home *** CD-ROM | disk | FTP | other *** search
/ PC World 2002 September / PCWorld_2002-09_cd.bin / Software / Vyzkuste / httrack / httrack-3.20RC4.exe / {app} / src / htslib.c < prev    next >
C/C++ Source or Header  |  2002-07-09  |  107KB  |  4,015 lines

  1. /* ------------------------------------------------------------ */
  2. /*
  3. HTTrack Website Copier, Offline Browser for Windows and Unix
  4. Copyright (C) Xavier Roche and other contributors
  5.  
  6. This program is free software; you can redistribute it and/or
  7. modify it under the terms of the GNU General Public License
  8. as published by the Free Software Foundation; either version 2
  9. of the License, or any later version.
  10.  
  11. This program is distributed in the hope that it will be useful,
  12. but WITHOUT ANY WARRANTY; without even the implied warranty of
  13. MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
  14. GNU General Public License for more details.
  15.  
  16. You should have received a copy of the GNU General Public License
  17. along with this program; if not, write to the Free Software
  18. Foundation, Inc., 59 Temple Place - Suite 330, Boston, MA  02111-1307, USA.
  19.  
  20.  
  21. Important notes:
  22.  
  23. - We hereby ask people using this source NOT to use it in purpose of grabbing
  24. emails addresses, or collecting any other private information on persons.
  25. This would disgrace our work, and spoil the many hours we spent on it.
  26.  
  27.  
  28. Please visit our Website: http://www.httrack.com
  29. */
  30.  
  31.  
  32. /* ------------------------------------------------------------ */
  33. /* File: Subroutines                                            */
  34. /* Author: Xavier Roche                                         */
  35. /* ------------------------------------------------------------ */
  36.  
  37. // Fichier librairie .c
  38.  
  39. #include "htslib.h"
  40. #include "htsbauth.h"
  41.  
  42. /* specific definitions */
  43. #include "htsbase.h"
  44. #include "htsnet.h"
  45. #include "htsbauth.h"
  46. #include "htsthread.h"
  47. #include "htsnostatic.h"
  48. #include "htswrap.h"
  49. #include <stdio.h>
  50. #if HTS_WIN
  51. #include <direct.h>
  52. #else
  53. #include <unistd.h>
  54. #endif
  55. #include <stdlib.h>
  56. #include <string.h>
  57. #include <time.h>
  58. #include <sys/timeb.h>
  59. #include <fcntl.h>
  60. // pour utimbuf
  61. #if HTS_WIN
  62. #include <sys/utime.h>
  63. #else
  64. #if HTS_PLATFORM!=3
  65. #include <utime.h>
  66. #else
  67. #include <utime.h>
  68. #endif
  69. #endif
  70. /* END specific definitions */
  71.  
  72.  
  73.  
  74. // DΘbuggage de contr⌠le
  75. #if HTS_DEBUG_CLOSESOCK
  76. #define _HTS_WIDE 1
  77. #endif
  78. #if HTS_WIDE_DEBUG
  79. #define _HTS_WIDE 1
  80. #endif
  81. #if _HTS_WIDE
  82. FILE* DEBUG_fp=NULL;
  83. #define DEBUG_W(A)  { if (DEBUG_fp==NULL) DEBUG_fp=fopen("bug.out","wb"); fprintf(DEBUG_fp,":>"A); fflush(DEBUG_fp); }
  84. #define DEBUG_W2(A) { if (DEBUG_fp==NULL) DEBUG_fp=fopen("bug.out","wb"); fprintf(DEBUG_fp,A); fflush(DEBUG_fp); }
  85. #endif
  86.  
  87. /* variables globales */
  88. int _DEBUG_HEAD;
  89. FILE* ioinfo;
  90.  
  91. #if HTS_USEOPENSSL
  92.  SSL_CTX *openssl_ctx = NULL;
  93. #endif
  94.  
  95. /* dΘtection complΘmentaire */
  96. const char hts_detect[][32] = {
  97.   "archive",
  98.   "background",
  99.   "data",         // OBJECT
  100.   "dynsrc",
  101.   "lowsrc",
  102.   "profile",      // element META
  103.   "src",
  104.   "swurl",
  105.   "url",
  106.   "usemap",
  107.   "longdesc",     // accessibility
  108.   "xlink:href",   // xml/svg tag
  109.   ""
  110. };
  111.  
  112. /* dΘtecter dΘbut */
  113. const char hts_detectbeg[][32] = {
  114.   "hotspot",      /* hotspot1=..,hotspot2=.. */
  115.   ""
  116. };
  117.  
  118. /* ne pas dΘtcter de liens dedans */
  119. const char hts_nodetect[][32] = {
  120.   "accept-charset",
  121.   "accesskey",
  122.   "action",
  123.   "align",
  124.   "alt",
  125.   "axes",
  126.   "axis",
  127.   "char",
  128.   "charset",
  129.   "cite",
  130.   "class",
  131.   "classid",
  132.   "code",
  133.   "color",
  134.   "datetime",
  135.   "dir",
  136.   "enctype",
  137.   "face",
  138.   "height",
  139.   "id",
  140.   "lang",
  141.   "language",
  142.   "media",
  143.   "method",
  144.   "name",
  145.   "prompt",
  146.   "scheme",
  147.   "size",
  148.   "style",
  149.   "target",
  150.   "title",
  151.   "type",
  152.   "valign",
  153.   "version",
  154.   "width",
  155.   ""
  156. };
  157.  
  158.  
  159. /* dΘtection de mini-code javascript */
  160. /* ALSO USED: detection based on the name: onXXX="<tag>" where XXX starts with upper case letter */
  161. const char hts_detect_js[][32] = {
  162.   "onAbort",
  163.   "onBlur",
  164.   "onChange",
  165.   "onClick",
  166.   "onDblClick",
  167.   "onDragDrop",
  168.   "onError",
  169.   "onFocus",
  170.   "onKeyDown",
  171.   "onKeyPress",
  172.   "onKeyUp",
  173.   "onLoad",
  174.   "onMouseDown",
  175.   "onMouseMove",
  176.   "onMouseOut",
  177.   "onMouseOver",
  178.   "onMouseUp",
  179.   "onMove",
  180.   "onReset",
  181.   "onResize",
  182.   "onSelect",
  183.   "onSubmit",
  184.   "onUnload",
  185.   ""
  186. };
  187.  
  188. /* dΘtection "...URL=<url>" */
  189. const char hts_detectURL[][32] = {
  190.   "content",
  191.   ""
  192. };
  193.  
  194. /* tags o∙ l'URL doit Ωtre rΘΘcrite mais non capturΘe */
  195. const char hts_detectandleave[][32] = {
  196.   "action",
  197.   ""
  198. };
  199.  
  200. /* ne pas renommer les types renvoyΘs (couvent types inconnus) */
  201. const char hts_mime_keep[][32] = {
  202.   "application/octet-stream",
  203.   "text/plain",
  204.   ""
  205. };
  206.  
  207. /* pas de type mime connu, mais extension connue */
  208. const char hts_ext_dynamic[][32] = {
  209.   "php3",
  210.   "php",
  211.   "php4",
  212.   "php2",
  213.   "cgi",
  214.   "asp",
  215.   "jsp",
  216.   "pl",
  217.   /*"exe",*/
  218.   "cfm",
  219.   ""
  220. };
  221.  
  222. /* types MIME */
  223. const char hts_mime[][2][32] = {
  224.   {"application/acad","dwg"},
  225.   {"application/arj","arj"},
  226.   {"application/clariscad","ccad"},
  227.   {"application/drafting","drw"},
  228.   {"application/dxf","dxf"},
  229.   {"application/excel","xl"},
  230.   {"application/i-deas","unv"},
  231.   {"application/iges","isg"},
  232.   {"application/iges","iges"},
  233.   {"application/mac-binhex40","hqx"},
  234.   {"application/mac-compactpro","cpt"},
  235.   {"application/msword","doc"},
  236.   {"application/msword","w6w"},
  237.   {"application/msword","word"},
  238.   {"application/mswrite","wri"},
  239.   /*{"application/octet-stream","dms"},*/
  240.   /*{"application/octet-stream","lzh"},*/
  241.   /*{"application/octet-stream","lha"},*/
  242.   /*{"application/octet-stream","bin"},*/
  243.   {"application/oda","oda"},
  244.   {"application/pdf","pdf"},
  245.   {"application/postscript","ps"},
  246.   {"application/postscript","ai"},
  247.   {"application/postscript","eps"},
  248.   {"application/powerpoint","ppt"},
  249.   {"application/pro_eng","prt"},
  250.   {"application/pro_eng","part"},
  251.   {"application/rtf","rtf"},
  252.   {"application/set","set"},
  253.   {"application/sla","stl"},
  254.   {"application/smil","smi"},
  255.   {"application/smil","smil"},
  256.   {"application/smil","sml"},
  257.   {"application/solids","sol"},
  258.   {"application/STEP","stp"},
  259.   {"application/STEP","step"},
  260.   {"application/vda","vda"},
  261.   {"application/x-authorware-map","aam"},     
  262.   {"application/x-authorware-seg","aas"},
  263.   {"application/x-authorware-bin","aab"},
  264.   {"application/x-cocoa","cco"},
  265.   {"application/x-csh","csh"},
  266.   {"application/x-director","dir"},
  267.   {"application/x-director","dcr"},
  268.   {"application/x-director","dxr"},
  269.   {"application/x-mif","mif"},
  270.   {"application/x-dvi","dvi"},
  271.   {"application/x-gzip","gz"},
  272.   {"application/x-gzip","gzip"},
  273.   {"application/x-hdf","hdf"},
  274.   {"application/x-javascript","js"},
  275.   {"application/x-koan","skp"},
  276.   {"application/x-koan","skd"},
  277.   {"application/x-koan","skt"},
  278.   {"application/x-koan","skm"},
  279.   {"application/x-latex","latex"},
  280.   {"application/x-netcdf","nc"},
  281.   {"application/x-netcdf","cdf"},
  282.   /* {"application/x-sh","sh"}, */
  283.   /* {"application/x-csh","csh"}, */
  284.   /* {"application/x-ksh","ksh"}, */
  285.   {"application/x-shar","shar"},
  286.   {"application/x-stuffit","sit"},
  287.   {"application/x-tcl","tcl"},
  288.   {"application/x-tex","tex"},
  289.   {"application/x-texinfo","texinfo"},
  290.   {"application/x-texinfo","texi"},
  291.   {"application/x-troff","t"},
  292.   {"application/x-troff","tr"},
  293.   {"application/x-troff","roff"},
  294.   {"application/x-troff-man","man"},
  295.   {"application/x-troff-me","ms"},
  296.   {"application/x-wais-source","src"},
  297.   {"application/zip","zip"},
  298.   {"application/x-zip-compressed","zip"},
  299.   {"application/x-bcpio","bcpio"},
  300.   {"application/x-cdlink","vcd"},
  301.   {"application/x-cpio","cpio"},
  302.   {"application/x-gtar","tgz"},
  303.   {"application/x-gtar","gtar"},
  304.   {"application/x-shar","shar"},
  305.   {"application/x-shockwave-flash","swf"},
  306.   {"application/x-sv4cpio","sv4cpio"},
  307.   {"application/x-sv4crc","sv4crc"},
  308.   {"application/x-tar","tar"},
  309.   {"application/x-ustar","ustar"},
  310.   {"application/x-winhelp","hlp"},
  311.   {"audio/midi","mid"},
  312.   {"audio/midi","midi"},
  313.   {"audio/midi","kar"},
  314.   {"audio/mpeg","mp3"},
  315.   {"audio/mpeg","mpga"},
  316.   {"audio/mpeg","mp2"},
  317.   {"audio/basic","au"},
  318.   {"audio/basic","snd"},
  319.   {"audio/x-aiff","aif"},
  320.   {"audio/x-aiff","aiff"},
  321.   {"audio/x-aiff","aifc"},
  322.   {"audio/x-pn-realaudio","rm"},
  323.   {"audio/x-pn-realaudio","ram"},
  324.   {"audio/x-pn-realaudio","ra"},
  325.   {"audio/x-pn-realaudio-plugin","rpm"},
  326.   {"audio/x-wav","wav"},
  327.   {"chemical/x-pdb","pdb"},
  328.   {"chemical/x-pdb","xyz"},
  329.   {"drawing/x-dwf","dwf"},
  330.   {"image/gif","gif"},
  331.   {"image/ief","ief"},
  332.   {"image/jpeg","jpg"},
  333.   {"image/jpeg","jpe"},
  334.   {"image/jpeg","jpeg"},
  335.   {"image/pict","pict"},
  336.   {"image/png","png"},
  337.   {"image/tiff","tiff"},
  338.   {"image/tiff","tif"},
  339.   {"image/svg+xml","svg"},
  340.   {"image/x-cmu-raster","ras"},
  341.   {"image/x-freehand","fh4"},
  342.   {"image/x-freehand","fh7"},
  343.   {"image/x-freehand","fh5"},  
  344.   {"image/x-freehand","fhc"},
  345.   {"image/x-freehand","fh"},   
  346.   {"image/x-portable-anymap","pnm"},
  347.   {"image/x-portable-bitmap","pgm"},
  348.   {"image/x-portable-pixmap","ppm"},
  349.   {"image/x-rgb","rgb"},
  350.   {"image/x-xbitmap","xbm"},
  351.   {"image/x-xpixmap","xpm"},
  352.   {"image/x-xwindowdump","xwd"},
  353.   {"model/mesh","msh"},  
  354.   {"model/mesh","mesh"},  
  355.   {"model/mesh","silo"},  
  356.   {"multipart/x-zip","zip"},
  357.   {"multipart/x-gzip","gzip"},
  358.   {"text/css","css"},
  359.   {"text/html","html"},
  360.   {"text/html","htm"},
  361.   {"text/plain","txt"},
  362.   {"text/plain","g"},
  363.   {"text/plain","h"},
  364.   {"text/plain","c"},
  365.   {"text/plain","cc"},
  366.   {"text/plain","hh"},
  367.   {"text/plain","m"},
  368.   {"text/plain","f90"},
  369.   {"text/richtext","rtx"},
  370.   {"text/tab-separated-values","tsv"},
  371.   {"text/x-setext","etx"},
  372.   {"text/x-sgml","sgml"},
  373.   {"text/x-sgml","sgm"},
  374.   {"text/xml","xml"},  
  375.   {"text/xml","dtd"},  
  376.   {"video/mpeg","mpeg"},
  377.   {"video/mpeg","mpg"},
  378.   {"video/mpeg","mpe"},
  379.   {"video/quicktime","qt"},
  380.   {"video/quicktime","mov"},
  381.   {"video/x-msvideo","avi"},
  382.   {"video/x-sgi-movie","movie"},
  383.   {"x-conference/x-cooltalk","ice"},
  384.   /*{"application/x-httpd-cgi","cgi"},*/
  385.   {"x-world/x-vrml","wrl"},
  386.   
  387.   {"*","class"},
  388.   
  389.   {"",""}};
  390.  
  391.  
  392. // Reserved (RFC2396)
  393. #define CHAR_RESERVED(c)  ( strchr(";/?:@&=+$,",(unsigned char)(c)) != 0 )
  394. // Delimiters (RFC2396)
  395. #define CHAR_DELIM(c)     ( strchr("<>#%\"",(unsigned char)(c)) != 0 )
  396. // Unwise (RFC2396)
  397. #define CHAR_UNWISE(c)    ( strchr("{}|\\^[]`",(unsigned char)(c)) != 0 )
  398. // Special (escape chars) (RFC2396 + >127 )
  399. #define CHAR_LOW(c)       ( ((unsigned char)(c) <= 31) )
  400. #define CHAR_HIG(c)       ( ((unsigned char)(c) >= 127) )
  401. #define CHAR_SPECIAL(c)   ( CHAR_LOW(c) || CHAR_HIG(c) )
  402. // We try to avoid them and encode them instead
  403. #define CHAR_XXAVOID(c)   ( strchr(" *'\"!",(unsigned char)(c)) != 0 )
  404.  
  405.  
  406. // conversion Θventuelle / vers antislash
  407. #if HTS_WIN
  408. char* antislash(char* s) {
  409.   char* buff;
  410.   char* a;
  411.   NOSTATIC_RESERVE(buff, char, HTS_URLMAXSIZE*2);
  412.  
  413.   strcpy(buff,s);
  414.   while(a=strchr(buff,'/')) *a='\\';
  415.   return buff;
  416. }
  417. #endif
  418.  
  419.  
  420.  
  421. // RΘcupΘration d'un fichier http sur le net.
  422. // Renvoie une adresse sur le bloc de mΘmoire, ou bien
  423. // NULL si un retour.msgeur (buffer retour.msg) est survenue. 
  424. //
  425. // Une adresse de structure htsmsg peut Ωtre transmise pour
  426. // suivre l'Θvolution du chargement si le process a ΘtΘ lancΘ 
  427. // en background
  428.  
  429. htsblk httpget(char* url) {
  430.   char adr[HTS_URLMAXSIZE*2];   // adresse
  431.   char fil[HTS_URLMAXSIZE*2];   // chemin
  432.   
  433.   // sΘparer URL en adresse+chemin
  434.   if (ident_url_absolute(url,adr,fil)==-1) {
  435.     htsblk retour;
  436.     memset(&retour, 0, sizeof(htsblk));    // effacer
  437.     // retour prΘdΘfini: erreur
  438.     retour.adr=NULL;
  439.     retour.size=0;
  440.     retour.msg[0]='\0';
  441.     retour.statuscode=-1;    
  442.     strcpy(retour.msg,"Error invalid URL");
  443.     return retour;
  444.   }
  445.   
  446.   return xhttpget(adr,fil);
  447. }
  448.  
  449. // ouvre une liaison http, envoie une requΦte GET et rΘceptionne le header
  450. // retour: socket
  451. int http_fopen(char* adr,char* fil,htsblk* retour) {
  452.   //                / GET, traiter en-tΩte
  453.   return http_xfopen(0,1,1,NULL,adr,fil,retour);
  454. }
  455.  
  456. // ouverture d'une liaison http, envoi d'une requΦte
  457. // mode: 0 GET  1 HEAD  [2 POST]
  458. // treat: traiter header?
  459. // waitconnect: attendre le connect()
  460. // note: dans retour, on met les params du proxy
  461. int http_xfopen(int mode,int treat,int waitconnect,char* xsend,char* adr,char* fil,htsblk* retour) {
  462.   //htsblk retour;
  463.   //int bufl=TAILLE_BUFFER;    // 8Ko de buffer
  464.   T_SOC soc=INVALID_SOCKET;
  465.   //char *p,*q;
  466.   
  467.   // retour prΘdΘfini: erreur
  468.   if (retour) {
  469.     retour->adr=NULL;
  470.     retour->size=0;
  471.     retour->msg[0]='\0';
  472.     retour->statuscode=-5;          // a priori erreur non fatale
  473.   }
  474.  
  475. #if HDEBUG
  476.   printf("adr=%s\nfichier=%s\n",adr,fil);
  477. #endif
  478.   
  479.   // ouvrir liaison
  480. #if HDEBUG
  481.   printf("CrΘation d'une socket sur %s\n",adr);
  482. #endif
  483.  
  484. #if CNXDEBUG
  485.   printf("..newhttp\n");
  486. #endif
  487.  
  488.   /* connexion */
  489.   if (retour) {
  490.     if ( (!(retour->req.proxy.active)) || (strcmp(adr,"file://")==0) ) {    /* pas de proxy, ou non utilisable ici */
  491.       soc=newhttp(adr,retour,-1,waitconnect);
  492.     } else {
  493.       soc=newhttp(retour->req.proxy.name,retour,retour->req.proxy.port,waitconnect);  // ouvrir sur le proxy α la place
  494.     }
  495.   } else {
  496.     soc=newhttp(adr,NULL,-1,waitconnect);    
  497.   }
  498.  
  499.   // copier index socket retour
  500.   if (retour) retour->soc=soc;
  501.  
  502.   /* Check for errors */
  503.   if (soc == INVALID_SOCKET) {
  504.     if (retour) {
  505.       if (retour->msg) {
  506.         if (!strnotempty(retour->msg)) {
  507.           strcpy(retour->msg,"Connect error");
  508.         }
  509.       }
  510.     }
  511.   }
  512.  
  513.   // --------------------
  514.   // court-circuit (court circuite aussi le proxy..)
  515.   // LOCAL_SOCKET_ID est une pseudo-socket locale
  516.   if (soc==LOCAL_SOCKET_ID) {
  517.     retour->is_file=1;  // fichier local
  518.     if (mode==0) {    // GET
  519.  
  520.       // Test en cas de file:///C|...
  521.       if (!fexist(fconv(unescape_http(fil))))
  522.         if (fexist(fconv(unescape_http(fil+1)))) {
  523.           char tempo[HTS_URLMAXSIZE*2];
  524.           strcpy(tempo,fil+1);
  525.           strcpy(fil,tempo);
  526.         }
  527.  
  528.       // Ouvrir
  529.       retour->totalsize=fsize(fconv(unescape_http(fil)));  // taille du fichier
  530.       retour->msg[0]='\0';
  531.       soc=INVALID_SOCKET;
  532.       if (retour->totalsize<0)
  533.         strcpy(retour->msg,"Unable to open file");
  534.       else if (retour->totalsize==0)
  535.         strcpy(retour->msg,"File empty");
  536.       else {
  537.         // Note: On passe par un FILE* (plus propre)
  538.         //soc=open(fil,O_RDONLY,0);    // en lecture seule!
  539.         retour->fp=fopen(fconv(unescape_http(fil)),"rb");  // ouvrir
  540.         if (retour->fp==NULL)
  541.           soc=INVALID_SOCKET;
  542.         else
  543.           soc=LOCAL_SOCKET_ID;
  544.       }
  545.       retour->soc=soc;
  546.       if (soc!=INVALID_SOCKET) {
  547.         retour->statuscode=200;   // OK
  548.         strcpy(retour->msg,"OK");
  549.         guess_httptype(retour->contenttype,fil);
  550.       } else if (strnotempty(retour->msg)==0)
  551.           strcpy(retour->msg,"Unable to open file");
  552.       return soc;  // renvoyer
  553.     } else {    // HEAD ou POST : interdit sur un local!!!! (c'est idiot!)
  554.       strcpy(retour->msg,"Unexpected Head/Post local request");
  555.       soc=INVALID_SOCKET;    // erreur
  556.       retour->soc=soc;
  557.       return soc;
  558.     }
  559.   } 
  560.   // --------------------
  561.  
  562.   if (soc!=INVALID_SOCKET) {    
  563.     char rcvd[1100];
  564.     rcvd[0]='\0';
  565. #if HDEBUG
  566.     printf("Ok, connexion rΘussie, id=%d\n",soc);
  567. #endif
  568.     
  569.     // connectΘ?
  570.     if (waitconnect) {
  571.       http_sendhead(NULL,mode,xsend,adr,fil,NULL,NULL,retour);
  572.     } 
  573.     
  574.     if (soc!=INVALID_SOCKET) {
  575.       
  576. #if HDEBUG
  577.       printf("Attente de la rΘponse:\n");
  578. #endif
  579.       
  580.       // si GET (rΘception d'un fichier), rΘceptionner en-tΩte d'abord,
  581.       // et ensuite le corps
  582.       // si POST on ne rΘceptionne rien du tout, c'est aprΦs que l'on fera
  583.       // une rΘception standard pour rΘcupΘrer l'en tΩte
  584.       if ((treat) && (waitconnect)) {  // traiter (attendre!) en-tΩte        
  585.         // RΘception de la status line et de l'en-tΩte (norme RFC1945)
  586.         
  587.         // status-line α rΘcupΘrer
  588.         finput(soc,rcvd,1024);
  589.         if (strnotempty(rcvd)==0)
  590.           finput(soc,rcvd,1024);    // "certains serveurs buggΘs envoient un \n au dΘbut" (RFC)
  591.  
  592.         // traiter status-line
  593.         treatfirstline(retour,rcvd);
  594.  
  595. #if HDEBUG
  596.         printf("Status-Code=%d\n",retour->statuscode);
  597. #endif
  598.         
  599.         // en-tΩte
  600.         
  601.         // header // ** !attention! HTTP/0.9 non supportΘ
  602.         do {
  603.           finput(soc,rcvd,1024);          
  604. #if HDEBUG
  605.           printf(">%s\n",rcvd);      
  606. #endif
  607.           if (strnotempty(rcvd))
  608.             treathead(NULL,NULL,NULL,retour,rcvd);  // traiter
  609.  
  610.         } while(strnotempty(rcvd));
  611.         
  612.         //rcvsize=-1;    // forCER CHARGEMENT INCONNU
  613.         
  614.         //if (retour)
  615.         //  retour->totalsize=rcvsize;
  616.         
  617.       } else { // si GET, on recevra l'en tΩte APRES
  618.         //rcvsize=-1;    // on ne connait pas la taille de l'en-tΩte
  619.         if (retour)
  620.           retour->totalsize=-1;
  621.       }
  622.       
  623.     }
  624.  
  625.   }
  626.     
  627.   return soc;
  628. }
  629.  
  630.  
  631. // envoi d'une requΦte
  632. int http_sendhead(t_cookie* cookie,int mode,char* xsend,char* adr,char* fil,char* referer_adr,char* referer_fil,htsblk* retour) {
  633.   char buff[8192];
  634.   //int use_11=0;     // HTTP 1.1 utilisΘ
  635.   int direct_url=0; // ne pas analyser l'url (exemple: ftp://)
  636.   char* search_tag=NULL;
  637.   buff[0]='\0';
  638.  
  639.   // header Date
  640.   //strcat(buff,"Date: ");
  641.   //time_gmt_rfc822(buff);    // obtenir l'heure au format rfc822
  642.   //sendc("\n");
  643.   //strcat(buff,buff);
  644.  
  645.   // possibilitΘ non documentΘe: >post: et >postfile:
  646.   // si prΘsence d'un tag >post: alors executer un POST
  647.   // exemple: http://www.someweb.com/test.cgi?foo>post:posteddata=10&foo=5
  648.   // si prΘsence d'un tag >postfile: alors envoyer en tΩte brut contenu dans le fichier en question
  649.   // exemple: http://www.someweb.com/test.cgi?foo>postfile:post0.txt
  650.   search_tag=strstr(fil,POSTTOK":");
  651.   if (!search_tag) {
  652.     search_tag=strstr(fil,POSTTOK"file:");
  653.     if (search_tag) {     // postfile
  654.       if (mode==0) {      // GET!
  655.         FILE* fp=fopen(unescape_http(search_tag+strlen(POSTTOK)+5),"rb");
  656.         if (fp) {
  657.           char line[1100];
  658.           char protocol[256],url[HTS_URLMAXSIZE*2],method[256];
  659.           linput(fp,line,1000);
  660.           if (sscanf(line,"%s %s %s",method,url,protocol) == 3) {
  661.             // selon que l'on a ou pas un proxy
  662.             if (retour->req.proxy.active)
  663.               sprintf(buff,"%s http://%s%s %s\r\n",method,adr,url,protocol);
  664.             else
  665.               sprintf(buff,"%s %s %s\r\n",method,url,protocol);
  666.             // lire le reste en brut
  667.             fread(buff+strlen(buff),8000-strlen(buff),1,fp);
  668.           }
  669.           fclose(fp);
  670.         }
  671.       }
  672.     }
  673.   }
  674.   // Fin postfile
  675.   
  676.   if (strnotempty(buff)==0) {    // PAS POSTFILE
  677.     // Type de requΦte?
  678.     if ((search_tag) && (mode==0)) {
  679.       strcat(buff,"POST ");
  680.     } else if (mode==0) {    // GET
  681.       strcat(buff,"GET ");
  682.     } else {  // if (mode==1) {
  683.       if (!retour->req.http11)        // forcer HTTP/1.0
  684.         strcat(buff,"GET ");      // certains serveurs (cgi) buggent avec HEAD
  685.       else
  686.         strcat(buff,"HEAD ");
  687.     }
  688.     
  689.     // si on gΦre un proxy, il faut une Absolute URI: on ajoute avant http://www.adr.dom
  690.     if (retour->req.proxy.active) {
  691.       if (!strfield(adr,"ftp://")) {
  692. #if HDEBUG
  693.         printf("Proxy Use: for %s%s proxy %d port %d\n",adr,fil,retour->req.proxy.name,retour->req.proxy.port);
  694. #endif
  695.         strcat(buff,"http://");
  696.         strcat(buff,jump_identification(adr));
  697.       } else {          // ftp:// en proxy http
  698. #if HDEBUG
  699.         printf("Proxy Use for ftp: for %s%s proxy %d port %d\n",adr,fil,retour->req.proxy.name,retour->req.proxy.port);
  700. #endif
  701.         direct_url=1;             // ne pas analyser user/pass
  702.         strcat(buff,adr);
  703.       }
  704.     } 
  705.     
  706.     // NOM DU FICHIER
  707.     // on slash doit Ωtre prΘsent en dΘbut, sinon attention aux bad request! (400)
  708.     if (*fil!='/') strcat(buff,"/");
  709.     {
  710.       char tempo[HTS_URLMAXSIZE*2];
  711.       tempo[0]='\0';
  712.       if (search_tag)
  713.         strncat(tempo,fil,(int) (search_tag - fil));
  714.       else
  715.         strcpy(tempo,fil);
  716.       escape_check_url(tempo);
  717.       strcat(buff,tempo);       // avec Θchappement
  718.     }
  719.     
  720.     // protocole
  721.     if (!retour->req.http11) {     // forcer HTTP/1.0
  722.       //use_11=0;
  723.       strcat(buff," HTTP/1.0\x0d\x0a");
  724.     } else {                   // RequΦte 1.1
  725.       //use_11=1;
  726.       strcat(buff," HTTP/1.1\x0d\x0a");
  727.     }
  728.  
  729.     /* supplemental data */
  730.     if (xsend) strcat(buff,xsend);    // Θventuelles autres lignes
  731.  
  732.     // tester proxy authentication
  733.     if (retour->req.proxy.active) {
  734.       char* a=jump_identification(retour->req.proxy.name);
  735.       if (a!=retour->req.proxy.name) {  // et hop, authentification proxy!
  736.         char autorisation[1100];
  737.         char user_pass[256];        
  738.         autorisation[0]=user_pass[0]='\0';
  739.         //
  740.         strncat(user_pass,retour->req.proxy.name,(int) (a - retour->req.proxy.name) - 1);
  741.         strcpy(user_pass,unescape_http(user_pass));
  742.         code64(user_pass,autorisation);
  743.         strcat(buff,"Proxy-Authorization: Basic ");
  744.         strcat(buff,autorisation);
  745.         strcat(buff,H_CRLF);
  746. #if HDEBUG
  747.         printf("Proxy-Authenticate, %s (code: %s)\n",user_pass,autorisation);
  748. #endif
  749.       }
  750.     }
  751.     
  752.     // Referer?
  753.     if ((referer_adr) && (referer_fil)) {       // existe
  754.       if ((strnotempty(referer_adr)) && (strnotempty(referer_fil))) {   // non vide
  755.         if (strcmp(referer_adr,"file://")) {      // PAS file://
  756.           strcat(buff,"Referer: ");
  757.           strcat(buff,"http://");
  758.           strcat(buff,jump_identification(referer_adr));
  759.           strcat(buff,referer_fil);
  760.           strcat(buff,H_CRLF);
  761.         }
  762.       }
  763.     }
  764.     
  765.     // POST?
  766.     if (mode==0) {      // GET!
  767.       if (search_tag) {
  768.         char clen[256];
  769.         sprintf(clen,"Content-length: %d"H_CRLF,(int)(strlen(unescape_http(search_tag+strlen(POSTTOK)+1))));
  770.         strcat(buff,clen);
  771.       }
  772.     }
  773.     
  774.     // gestion cookies?
  775.     if (cookie) {
  776.       char* b=cookie->data;
  777.       int cook=0;
  778.       int max_cookies=8;
  779.       int max_size=2048;
  780.       max_size+=strlen(buff);
  781.       do {
  782.         b=cookie_find(b,"",jump_identification(adr),fil);       // prochain cookie satisfaisant aux conditions
  783.         if (b) {
  784.           max_cookies--;
  785.           if (!cook) {
  786.             strcat(buff,"Cookie: ");
  787.             strcat(buff,"$Version=1; ");
  788.             cook=1;
  789.           } else
  790.             strcat(buff,"; ");
  791.           strcat(buff,cookie_get(b,5));
  792.           strcat(buff,"=");
  793.           strcat(buff,cookie_get(b,6));
  794.           strcat(buff,"; $Path=");
  795.           strcat(buff,cookie_get(b,2));
  796.           b=cookie_nextfield(b);
  797.         }
  798.       } while( (b) && (max_cookies>0) && ((int)strlen(buff)<max_size));
  799.       if (cook) {                           // on a envoyΘ un (ou plusieurs) cookie?
  800.         strcat(buff,H_CRLF);
  801. #if DEBUG_COOK
  802.         printf("Header:\n%s\n",buff);
  803. #endif
  804.       }
  805.     }
  806.     
  807.     // connection close?
  808.     //if (use_11)     // Si on envoie une requΦte 1.1, prΘciser qu'on ne veut pas de keep-alive!!
  809.     strcat(buff,"Connection: close"H_CRLF);
  810.     
  811.     // gΘrer le keep-alive (garder socket)
  812.     //strcat(buff,"Connection: Keep-Alive\n");
  813.     
  814.     {
  815.       char* real_adr=jump_identification(adr);
  816.       //if ((use_11) || (retour->user_agent_send)) {   // Pour le 1.1 on utilise un Host:
  817.       if (!direct_url) {     // pas ftp:// par exemple
  818.         //if (!retour->req.proxy.active) {
  819.         strcat(buff,"Host: "); strcat(buff,real_adr); strcat(buff,H_CRLF);
  820.         //}
  821.       }
  822.       //}
  823.  
  824.       // PrΘsence d'un user-agent?
  825.       if (retour->req.user_agent_send) {  // ohh un user-agent
  826.         char s[256];
  827.         // HyperTextSeeker/"HTSVERSION
  828.         sprintf(s,"User-Agent: %s"H_CRLF,retour->req.user_agent);
  829.         strcat(buff,s);
  830.         
  831.         // pour les serveurs difficiles
  832.         strcat(buff,"Accept: image/gif, image/x-xbitmap, image/jpeg, image/pjpeg, image/svg+xml, */*"H_CRLF);
  833.         if (strnotempty(retour->req.lang_iso)) {
  834.           strcat(buff,"Accept-Language: "); strcat(buff,retour->req.lang_iso); strcat(buff,H_CRLF);
  835.         }
  836.         strcat(buff,"Accept-Charset: iso-8859-1, *"H_CRLF);   
  837.         if (retour->req.http11) {
  838. #if HTS_USEZLIB
  839.           if ((!retour->req.range_used) && (!retour->req.nocompression))
  840.             strcat(buff,"Accept-Encoding: gzip, deflate, compress, identity"H_CRLF);
  841.           else
  842.             strcat(buff,"Accept-Encoding: identity"H_CRLF);       /* no compression */
  843. #else
  844.           strcat(buff,"Accept-Encoding: identity"H_CRLF);         /* no compression */
  845. #endif
  846.         }
  847.       } else {
  848.         strcat(buff,"Accept: */*"H_CRLF);         // le minimum
  849.       }
  850.  
  851.       /* Authentification */
  852.       {
  853.         char autorisation[1100];
  854.         char* a;
  855.         autorisation[0]='\0';
  856.         if (real_adr != adr) {  // ohh une authentification!
  857.           if (!direct_url) {      // pas ftp:// par exemple
  858.             char user_pass[256];
  859.             user_pass[0]='\0';
  860.             strncat(user_pass,adr,(int) (real_adr - adr) - 1);
  861.             strcpy(user_pass,unescape_http(user_pass));
  862.             code64(user_pass,autorisation);
  863.             if (strcmp(fil,"/robots.txt"))      /* pas robots.txt */
  864.               bauth_add(cookie,real_adr,fil,autorisation);
  865.           }
  866.         } else if ( (a=bauth_check(cookie,real_adr,fil)) )
  867.           strcpy(autorisation,a);
  868.         /* On a une autorisation a donner?  */
  869.         if (strnotempty(autorisation)) {
  870.           strcat(buff,"Authorization: Basic ");
  871.           strcat(buff,autorisation);
  872.           strcat(buff,H_CRLF);
  873.         }
  874.       }
  875.  
  876.     }
  877.     //strcat(buff,"Accept-Language: en\n");
  878.     //strcat(buff,"Accept-Charset: iso-8859-1,*,utf-8\n");
  879.     
  880.     // CRLF de fin d'en tΩte
  881.     strcat(buff,H_CRLF);
  882.     
  883.     // donnΘes complΘmentaires?
  884.     if (search_tag)
  885.     if (mode==0)      // GET!
  886.       strcat(buff,unescape_http(search_tag+strlen(POSTTOK)+1));
  887.   }
  888.   
  889. #if HDEBUG
  890. #endif
  891.   if (_DEBUG_HEAD) {
  892.     if (ioinfo) {
  893.       fprintf(ioinfo,"request for %s%s:\r\n",jump_identification(adr),fil);
  894.       fprintfio(ioinfo,buff,"<<< ");
  895.       fprintf(ioinfo,"\r\n");
  896.       fflush(ioinfo);
  897.     }
  898.   }  // Fin test pas postfile
  899.   //
  900.  
  901.   // Envoi
  902.   if (sendc(retour, buff)<0) {  // ERREUR, socket rompue?...
  903.   //if (sendc(retour->soc,buff) != strlen(buff)) {  // ERREUR, socket rompue?...
  904.     deletesoc_r(retour);  // fermer tout de mΩme
  905.     // et tenter de reconnecter
  906.     
  907.     strcpy(retour->msg,"Broken pipe");
  908.     retour->soc=INVALID_SOCKET;
  909.   }
  910.   
  911.   // RX'98
  912.   return 0;
  913. }
  914.  
  915.  
  916.  
  917.  
  918. // traiter 1ere ligne d'en tΩte
  919. void treatfirstline(htsblk* retour,char* rcvd) {
  920.   char* a=rcvd;
  921.   // exemple:
  922.   // HTTP/1.0 200 OK
  923.   if (*a) {
  924.     // note: certains serveurs buggΘs renvoient HTTP/1.0\n200 OK ou " HTTP/1.0 200 OK"
  925.     while ((*a==' ') || (*a==10) || (*a==13) || (*a==9)) a++;      // Θpurer espaces au dΘbut
  926.     if (strfield(a, "HTTP/")) {
  927.       // sauter HTTP/1.x
  928.       while ((*a!=' ') && (*a!='\0') && (*a!=10) && (*a!=13) && (*a!=9)) a++;   
  929.       if (*a != '\0') {
  930.         while ((*a==' ') || (*a==10) || (*a==13) || (*a==9)) a++;      // Θpurer espaces
  931.         if ((*a>='0') && (*a<='9')) {
  932.           sscanf(a,"%d",&(retour->statuscode));
  933.           // sauter 200
  934.           while ((*a!=' ') && (*a!='\0') && (*a!=10) && (*a!=13) && (*a!=9)) a++;   
  935.           while ((*a==' ') || (*a==10) || (*a==13) || (*a==9)) a++;      // Θpurer espaces
  936.           if ((strlen(a) > 1) && (strlen(a) < 64) )                // message retour
  937.             strcpy(retour->msg,a);
  938.           else
  939.             infostatuscode(retour->msg,retour->statuscode);
  940.           // type MIME par dΘfaut
  941.           strcpy(retour->contenttype,HTS_HYPERTEXT_DEFAULT_MIME);
  942.         } else {  // pas de code!
  943.           retour->statuscode=-1;
  944.           strcpy(retour->msg,"Unknown response structure");
  945.         }
  946.       } else {  // euhh??
  947.         retour->statuscode=-1;
  948.         strcpy(retour->msg,"Unknown response structure");
  949.       }
  950.     } else {
  951.       if (strnotempty(a)) {
  952.         retour->statuscode=-1;
  953.         strcpy(retour->msg,"Unknown response structure, no HTTP/ response given");
  954.       } else {
  955.         /* This is dirty .. */
  956.         retour->statuscode=200;
  957.         strcpy(retour->msg, "Unknown, assuming junky server");
  958.         strcpy(retour->contenttype,HTS_HYPERTEXT_DEFAULT_MIME);
  959.       }
  960.     }
  961.   } else {  // vide!
  962.     /*
  963.     retour->statuscode=-1;
  964.     strcpy(retour->msg,"Empty reponse or internal error");
  965.     */
  966.     /* This is dirty .. */
  967.     retour->statuscode=200;
  968.     strcpy(retour->msg, "Unknown, assuming junky server");
  969.     strcpy(retour->contenttype,HTS_HYPERTEXT_DEFAULT_MIME);
  970.   }
  971. }
  972.  
  973. // traiter ligne par ligne l'en tΩte
  974. // gestion des cookies
  975. void treathead(t_cookie* cookie,char* adr,char* fil,htsblk* retour,char* rcvd) {
  976.   int p;
  977.   if ((p=strfield(rcvd,"Content-length:"))!=0) {
  978. #if HDEBUG
  979.     printf("ok, Content-length: dΘtectΘ\n");
  980. #endif
  981.     sscanf(rcvd+p,LLintP,&(retour->totalsize));
  982.   }
  983.   else if ((p=strfield(rcvd,"Content-Disposition:"))!=0) {
  984.     while(*(rcvd+p)==' ') p++;    // sauter espaces
  985.     if ((int) strlen(rcvd+p)<250) { // pas trop long?
  986.       char tmp[256];
  987.       char *a=NULL,*b=NULL;
  988.       strcpy(tmp,rcvd+p);
  989.       a=strstr(tmp,"filename=");
  990.       if (a) {
  991.         a+=strlen("filename=");
  992.         while(is_space(*a)) a++;
  993.         //a=strchr(a,'"');
  994.         if (a) {
  995.           char *c=NULL;
  996.           //a++;      /* jump " */
  997.           while((c=strchr(a,'/')))    /* skip all / (see RFC2616) */
  998.             a=c+1;
  999.           //b=strchr(a+1,'"');
  1000.           b=a+strlen(a)-1;
  1001.           while(is_space(*b)) b--;
  1002.           b++;
  1003.           if (b) {
  1004.             *b='\0';
  1005.             if ((int) strlen(a) < 200) { // pas trop long?
  1006.               strcpy(retour->cdispo,a);
  1007.             }
  1008.           }
  1009.         }
  1010.       } 
  1011.     }
  1012.   }
  1013.   else if ((p=strfield(rcvd,"Last-Modified:"))!=0) {
  1014.     while(*(rcvd+p)==' ') p++;    // sauter espaces
  1015.     if ((int) strlen(rcvd+p)<64) { // pas trop long?
  1016.       //struct tm* tm_time=convert_time_rfc822(rcvd+p);
  1017.       strcpy(retour->lastmodified,rcvd+p);
  1018.     }
  1019.   }
  1020.   else if ((p=strfield(rcvd,"Date:"))!=0) {
  1021.     if (strnotempty(retour->lastmodified)==0) {          /* pas encore de last-modified */
  1022.       while(*(rcvd+p)==' ') p++;    // sauter espaces
  1023.       if ((int) strlen(rcvd+p)<64) { // pas trop long?
  1024.         //struct tm* tm_time=convert_time_rfc822(rcvd+p);
  1025.         strcpy(retour->lastmodified,rcvd+p);
  1026.       }
  1027.     }
  1028.   }
  1029.   else if ((p=strfield(rcvd,"Etag:"))!=0) {   /* Etag */
  1030.     if (retour) {
  1031.       while(*(rcvd+p)==' ') p++;    // sauter espaces
  1032.       if ((int) strlen(rcvd+p)<64)  // pas trop long?
  1033.         strcpy(retour->etag,rcvd+p);
  1034.       else    // erreur.. ignorer
  1035.         retour->etag[0]='\0';
  1036.     }
  1037.   }
  1038.   else if ((p=strfield(rcvd,"Transfer-Encoding: chunked"))!=0) {  // chunk!
  1039.     retour->is_chunk=1;     // chunked
  1040.     //retour->http11=2;     // chunked
  1041. #if HDEBUG
  1042.     printf("ok, Transfer-Encoding: dΘtectΘ\n");
  1043. #endif
  1044.   }
  1045.   else if ((p=strfield(rcvd,"Content-type:"))!=0) {
  1046.     if (retour) {
  1047.       char tempo[1100];
  1048.       // Θviter les text/html; charset=foo
  1049.       {
  1050.         char* a=strchr(rcvd+p,';');
  1051.         if (a) *a='\0';
  1052.       }
  1053.       sscanf(rcvd+p,"%s",tempo);
  1054.       if (strlen(tempo)<64)    // pas trop long!!
  1055.         strcpy(retour->contenttype,tempo);
  1056.       else
  1057.         strcpy(retour->contenttype,"application/octet-stream-unknown");    // erreur
  1058.     }
  1059.   }
  1060.   else if ((p=strfield(rcvd,"Content-Range:"))!=0) {
  1061.     char* a=strstr(rcvd+p,"*/");
  1062.     if (a) {
  1063.       if (sscanf(a+2,LLintP,&retour->crange) != 1) {
  1064.         retour->crange=0;
  1065.       }
  1066.     }
  1067.   }
  1068.   else if ((p=strfield(rcvd,"Content-Encoding:"))!=0) {
  1069.     if (retour) {
  1070.       char tempo[1100];
  1071.       {
  1072.         char* a=strchr(rcvd+p,';');
  1073.         if (a) *a='\0';
  1074.       }
  1075.       sscanf(rcvd+p,"%s",tempo);
  1076.       if (strlen(tempo)<64)    // pas trop long!!
  1077.         strcpy(retour->contentencoding,tempo);
  1078.       else
  1079.         retour->contentencoding[0]='\0';    // erreur
  1080. #if HTS_USEZLIB
  1081.       if (retour->contentencoding[0])
  1082.         retour->compressed=1;
  1083. #endif
  1084.     }
  1085.   }
  1086.   else if ((p=strfield(rcvd,"Location:"))!=0) {
  1087.     if (retour) {
  1088.       if (retour->location) {
  1089.         while(*(rcvd+p)==' ') p++;    // sauter espaces
  1090.         if ((int) strlen(rcvd+p)<HTS_URLMAXSIZE)  // pas trop long?
  1091.           strcpy(retour->location,rcvd+p);
  1092.         else    // erreur.. ignorer
  1093.           retour->location[0]='\0';
  1094.       }
  1095.     }
  1096.   }
  1097.   else if ((p=strfield(rcvd,"Connection: Keep-Alive"))!=0) {
  1098.     // non, pas de keep-alive! on dΘconnectera..          
  1099.   }
  1100.   else if ((p=strfield(rcvd,"Keep-Alive:"))!=0) {    // params keep-alive
  1101.     // rien α faire          
  1102.   }
  1103.   else if ( ((p=strfield(rcvd,"Set-Cookie:"))!=0) && (cookie) ) {    // ohh un cookie
  1104.     char* a = rcvd+p;           // pointeur
  1105.     char domain[256];           // domaine cookie (.netscape.com)
  1106.     char path[256];             // chemin (/)
  1107.     char cook_name[256];        // nom cookie (MYCOOK)
  1108.     char cook_value[8192];      // valeur (ID=toto,S=1234)
  1109. #if DEBUG_COOK
  1110.     printf("set-cookie detected\n");
  1111. #endif
  1112.     while(*a) {
  1113.       char *token_st,*token_end;
  1114.       char *value_st,*value_end;
  1115.       char name[256];
  1116.       char value[8192];
  1117.       int next=0;
  1118.       name[0]=value[0]='\0';
  1119.       //
  1120.  
  1121.       // initialiser cookie lu actuellement
  1122.       if (adr)
  1123.         strcpy(domain,jump_identification(adr));     // domaine
  1124.       strcpy(path,"/");         // chemin (/)
  1125.       strcpy(cook_name,"");     // nom cookie (MYCOOK)
  1126.       strcpy(cook_value,"");    // valeur (ID=toto,S=1234)
  1127.       // boucler jusqu'au prochain cookie ou la fin
  1128.       do {
  1129.         char* start_loop=a;
  1130.         while(is_space(*a)) a++;    // sauter espaces
  1131.         token_st=a;                 // dΘpart token
  1132.         while((!is_space(*a)) && (*a) && (*a!=';') && (*a!='=')) a++;    // arrΩter si espace, point virgule
  1133.         token_end=a;
  1134.         while(is_space(*a)) a++;    // sauter espaces
  1135.         if (*a=='=') {    // name=value
  1136.           a++;
  1137.           while(is_space(*a)) a++;    // sauter espaces
  1138.           value_st=a;
  1139.           while( (*a!=';') && (*a)) a++;    // prochain ;
  1140.           //while( ((*a!='"') || (*(a-1)=='\\')) && (*a)) a++;    // prochain " (et pas \")
  1141.           value_end=a;
  1142.           //if (*a==';') {  // finit par un ;
  1143.           // vΘrifier dΘbordements
  1144.           if ( (((int) (token_end - token_st))<200) && (((int) (value_end - value_st))<8000)
  1145.             && (((int) (token_end - token_st))>0)   && (((int) (value_end - value_st))>0) ) {
  1146.             name[0]='\0';
  1147.             value[0]='\0';
  1148.             strncat(name,token_st,(int) (token_end - token_st));
  1149.             strncat(value,value_st,(int) (value_end - value_st));
  1150. #if DEBUG_COOK
  1151.             printf("detected cookie-av: name=\"%s\" value=\"%s\"\n",name,value);
  1152. #endif
  1153.             if (strfield2(name,"domain")) {
  1154.               strcpy(domain,value);
  1155.             }
  1156.             else if (strfield2(name,"path")) {
  1157.               strcpy(path,value);
  1158.             }
  1159.             else if (strfield2(name,"max-age")) {
  1160.               // ignorΘ..
  1161.             }
  1162.             else if (strfield2(name,"expires")) {
  1163.               // ignorΘ..
  1164.             }
  1165.             else if (strfield2(name,"version")) {
  1166.               // ignorΘ..
  1167.             }
  1168.             else if (strfield2(name,"comment")) {
  1169.               // ignorΘ
  1170.             }
  1171.             else if (strfield2(name,"secure")) {    // ne devrait pas arriver ici
  1172.               // ignorΘ
  1173.             }
  1174.             else {
  1175.               if (strnotempty(cook_name)==0) {          // noter premier: nom et valeur cookie
  1176.                 strcpy(cook_name,name);
  1177.                 strcpy(cook_value,value);
  1178.               } else {                             // prochain cookie
  1179.                 a=start_loop;      // on devra recommencer α cette position
  1180.                 next=1;            // enregistrer
  1181.               }
  1182.             }
  1183.           }
  1184.         }
  1185.         if (!next) {
  1186.           while((*a!=';') && (*a)) a++;    // prochain
  1187.           while(*a==';') a++;             // sauter ;
  1188.         }
  1189.       } while((*a) && (!next));
  1190.       if (strnotempty(cook_name)) {          // cookie?
  1191. #if DEBUG_COOK
  1192.         printf("new cookie: name=\"%s\" value=\"%s\" domain=\"%s\" path=\"%s\"\n",cook_name,cook_value,domain,path);
  1193. #endif
  1194.         cookie_add(cookie,cook_name,cook_value,domain,path);
  1195.       }
  1196.     }
  1197.   }
  1198. }
  1199.  
  1200.  
  1201. // transforme le message statuscode en chaεne
  1202. void infostatuscode(char* msg,int statuscode) {
  1203.   switch( statuscode) {    
  1204.     // Erreurs HTTP, selon RFC
  1205.   case 100: strcpy( msg,"Continue"); break; 
  1206.   case 101: strcpy( msg,"Switching Protocols"); break; 
  1207.   case 200: strcpy( msg,"OK"); break; 
  1208.   case 201: strcpy( msg,"Created"); break; 
  1209.   case 202: strcpy( msg,"Accepted"); break; 
  1210.   case 203: strcpy( msg,"Non-Authoritative Information"); break; 
  1211.   case 204: strcpy( msg,"No Content"); break; 
  1212.   case 205: strcpy( msg,"Reset Content"); break; 
  1213.   case 206: strcpy( msg,"Partial Content"); break; 
  1214.   case 300: strcpy( msg,"Multiple Choices"); break; 
  1215.   case 301: strcpy( msg,"Moved Permanently"); break; 
  1216.   case 302: strcpy( msg,"Moved Temporarily"); break; 
  1217.   case 303: strcpy( msg,"See Other"); break; 
  1218.   case 304: strcpy( msg,"Not Modified"); break; 
  1219.   case 305: strcpy( msg,"Use Proxy"); break; 
  1220.   case 306: strcpy( msg,"Undefined 306 error"); break; 
  1221.   case 307: strcpy( msg,"Temporary Redirect"); break; 
  1222.   case 400: strcpy( msg,"Bad Request"); break; 
  1223.   case 401: strcpy( msg,"Unauthorized"); break; 
  1224.   case 402: strcpy( msg,"Payment Required"); break; 
  1225.   case 403: strcpy( msg,"Forbidden"); break; 
  1226.   case 404: strcpy( msg,"Not Found"); break; 
  1227.   case 405: strcpy( msg,"Method Not Allowed"); break; 
  1228.   case 406: strcpy( msg,"Not Acceptable"); break; 
  1229.   case 407: strcpy( msg,"Proxy Authentication Required"); break; 
  1230.   case 408: strcpy( msg,"Request Time-out"); break; 
  1231.   case 409: strcpy( msg,"Conflict"); break; 
  1232.   case 410: strcpy( msg,"Gone"); break; 
  1233.   case 411: strcpy( msg,"Length Required"); break; 
  1234.   case 412: strcpy( msg,"Precondition Failed"); break; 
  1235.   case 413: strcpy( msg,"Request Entity Too Large"); break; 
  1236.   case 414: strcpy( msg,"Request-URI Too Large"); break; 
  1237.   case 415: strcpy( msg,"Unsupported Media Type"); break; 
  1238.   case 416: strcpy( msg,"Requested Range Not Satisfiable"); break; 
  1239.   case 417: strcpy( msg,"Expectation Failed"); break; 
  1240.   case 500: strcpy( msg,"Internal Server Error"); break; 
  1241.   case 501: strcpy( msg,"Not Implemented"); break; 
  1242.   case 502: strcpy( msg,"Bad Gateway"); break; 
  1243.   case 503: strcpy( msg,"Service Unavailable"); break; 
  1244.   case 504: strcpy( msg,"Gateway Time-out"); break; 
  1245.   case 505: strcpy( msg,"HTTP Version Not Supported"); break; 
  1246.     //
  1247.   default: if (strnotempty(msg)==0) strcpy( msg,"Unknown error"); break;
  1248.   }
  1249. }
  1250.  
  1251.  
  1252. // identique au prΘcΘdent, sauf que l'on donne adr+fil et non url complΦte
  1253. htsblk xhttpget(char* adr,char* fil) {
  1254.   T_SOC soc;
  1255.   htsblk retour;
  1256.   
  1257.   memset(&retour, 0, sizeof(htsblk));
  1258.   soc=http_fopen(adr,fil,&retour);
  1259.  
  1260.   if (soc!=INVALID_SOCKET) {
  1261.     http_fread(soc,&retour);
  1262. #if HTS_DEBUG_CLOSESOCK
  1263.     DEBUG_W("xhttpget: deletehttp\n");
  1264. #endif
  1265.     if (retour.soc!=INVALID_SOCKET) deletehttp(&retour);  // fermer
  1266.     retour.soc=INVALID_SOCKET;
  1267.   }
  1268.   return retour;
  1269. }
  1270.  
  1271. // variation sur un thΦme...
  1272. // rΘceptionne uniquement un en-tΩte (HEAD)
  1273. // retourne dans xx.adr l'adresse pointant sur le bloc de mΘmoire de l'en tΩte
  1274. htsblk http_gethead(char* adr,char* fil) {
  1275.   T_SOC soc;
  1276.   htsblk retour;
  1277.  
  1278.   memset(&retour, 0, sizeof(htsblk));
  1279.   soc=http_xfopen(1,0,1,NULL,adr,fil,&retour);  // HEAD, pas de traitement en-tΩte
  1280.  
  1281.   if (soc!=INVALID_SOCKET) {
  1282.     http_fread(soc,&retour);    // rΘception en-tΩte
  1283. #if HTS_DEBUG_CLOSESOCK
  1284.     DEBUG_W("http_gethead: deletehttp\n");
  1285. #endif
  1286.     if (retour.soc!=INVALID_SOCKET) deletehttp(&retour);  // fermer
  1287.     retour.soc=INVALID_SOCKET;
  1288.   }
  1289.   return retour;
  1290. }
  1291. // oui ca ressemble vachement α xhttpget - en Θtant sobre on peut voir LA diffΘrence..
  1292.  
  1293.  
  1294. // lecture sur une socket ouverte, le header a dΘja ΘtΘ envoyΘ dans le cas de GET
  1295. // il ne reste plus qu'α lire les donnΘes
  1296. // (pour HEAD le header est lu ici!)
  1297. void http_fread(T_SOC soc,htsblk* retour) {  
  1298.   //int bufl=TAILLE_BUFFER;    // 8Ko de buffer
  1299.   
  1300.   if (retour) retour->soc=soc;
  1301.   if (soc!=INVALID_SOCKET) {    
  1302.     // fonction de lecture d'une socket (plus propre)
  1303.     while(http_fread1(retour)!=-1);
  1304.     soc=retour->soc;
  1305.     if (retour->adr==NULL) {
  1306.       if (strnotempty(retour->msg)==0)
  1307.         sprintf(retour->msg,"Unable to read");
  1308.       return ;    // erreur
  1309.     } 
  1310.     
  1311. #if HDEBUG
  1312.     printf("Ok, donnΘes reτues\n");
  1313. #endif   
  1314.  
  1315.     return ;
  1316.     
  1317.   } 
  1318.   
  1319.   return ;
  1320. }
  1321.  
  1322. // check if data is available
  1323. int check_readinput(htsblk* r) {
  1324.   if (r->soc != INVALID_SOCKET) {
  1325.     fd_set fds;           // poll structures
  1326.     struct timeval tv;          // structure for select
  1327.     FD_ZERO(&fds);
  1328.     FD_SET(r->soc,&fds);           
  1329.     tv.tv_sec=0;
  1330.     tv.tv_usec=0;
  1331.     select(r->soc + 1,&fds,NULL,NULL,&tv);
  1332.     if (FD_ISSET(r->soc,&fds))
  1333.       return 1;
  1334.     else
  1335.       return 0;
  1336.   } else
  1337.     return 0;
  1338. }
  1339.  
  1340. // lecture d'un bloc sur une socket (ou un fichier!)
  1341. // >=0 : nombre d'octets lus
  1342. // <0 : fin ou erreur
  1343. HTS_INLINE LLint http_fread1(htsblk* r) {
  1344.   //int bufl=TAILLE_BUFFER;  // taille d'un buffer max.
  1345.   return http_xfread1(r,TAILLE_BUFFER);
  1346. }
  1347.  
  1348. // idem, sauf qu'ici on peut choisir la taille max de donnΘes α recevoir
  1349. // SI bufl==0 alors le buffer est censΘ Ωtre de 8kos, et on recoit par bloc de lignes
  1350. // en Θliminant les cr (ex: header), arrΩt si double-lf
  1351. // SI bufl==-1 alors le buffer est censΘ Ωtre de 8kos, et on recoit ligne par ligne
  1352. // en Θliminant les cr (ex: header), arrΩt si double-lf
  1353. // Note: les +1 dans les malloc sont d√s α l'octet nul rajoutΘ en fin de fichier
  1354. LLint http_xfread1(htsblk* r,int bufl) {
  1355.   int nl=-1;
  1356.  
  1357.   if (bufl>0) {
  1358.     if (!r->is_write) {     // stocker en mΘmoire
  1359.       if (r->totalsize>0) {    // totalsize dΘterminΘ ET ALLOUE
  1360.         if (r->adr==NULL) {
  1361.           r->adr=(char*) malloct((INTsys) r->totalsize + 1);
  1362.           r->size=0;
  1363.         }
  1364.         if (r->adr!=NULL) {
  1365.           // lecture
  1366.           nl = hts_read(r,r->adr + ((int) r->size),(int) (r->totalsize-r->size) );     /* NO 32 bit overlow possible here (no 4GB html!) */
  1367.           // nouvelle taille
  1368.           if (nl >= 0) r->size+=nl;
  1369.           
  1370.           if ((nl < 0) || (r->size >= r->totalsize))
  1371.             nl=-1;  // break
  1372.           
  1373.           r->adr[r->size]='\0';    // caractΦre NULL en fin au cas o∙ l'on traite des HTML
  1374.         }
  1375.         
  1376.       } else {                 // inconnu..
  1377.         // rΘserver de la mΘmoire?
  1378.         if (r->adr==NULL) {
  1379. #if HDEBUG
  1380.           printf("..alloc xfread\n");
  1381. #endif
  1382.           r->adr=(char*) malloct(bufl + 1);
  1383.           r->size=0;
  1384.         }
  1385.         else {
  1386. #if HDEBUG
  1387.           printf("..realloc xfread1\n");
  1388. #endif
  1389.           r->adr=(char*) realloct(r->adr,(int)r->size+bufl + 1);
  1390.         }
  1391.         
  1392.         if (r->adr!=NULL) {
  1393.           // lecture
  1394.           nl = hts_read(r,r->adr+(int)r->size,bufl);
  1395.           if (nl>0) {
  1396.             // resize
  1397.             r->adr=(char*) realloct(r->adr,(int)r->size+nl + 1);
  1398.             // nouvelle taille
  1399.             r->size+=nl;
  1400.             // octet nul
  1401.             if (r->adr) r->adr[r->size]='\0';
  1402.  
  1403.           } // sinon on a fini
  1404. #if HDEBUG
  1405.           else if (nl < 0)
  1406.             printf("..end read (%d)\n", nl);
  1407. #endif
  1408.         }
  1409. #if HDEBUG
  1410.         else printf("..-> error\n");
  1411. #endif
  1412.       }
  1413.  
  1414.       // pas de adr=erreur
  1415.       if (r->adr==NULL) nl=-1;
  1416.  
  1417.     } else {    // stocker sur disque
  1418.       char* buff;
  1419.       buff=(char*) malloct(bufl);
  1420.       if (buff!=NULL) {
  1421.         // lecture
  1422.         nl = hts_read(r,buff,bufl);
  1423.         // nouvelle taille
  1424.         if (nl > 0) { 
  1425.           r->size+=nl;
  1426.           if ((int) fwrite(buff,1,nl,r->out)!=nl) {
  1427.             r->statuscode=-1;
  1428.             strcpy(r->msg,"Write error on disk");
  1429.             nl=-1;
  1430.           }
  1431.         }
  1432.  
  1433.         if ((nl < 0) || ((r->totalsize>0) && (r->size >= r->totalsize)))
  1434.           nl=-1;  // break
  1435.  
  1436.         // libΘrer bloc tempo
  1437.         freet(buff);
  1438.       } else
  1439.         nl=-1;
  1440.       
  1441.       if ((nl < 0) && (r->out!=NULL)) {
  1442.         fflush(r->out); 
  1443.       }
  1444.         
  1445.         
  1446.     } // stockage disque ou mΘmoire
  1447.  
  1448.   } else {    // rΘception d'un en-tΩte octet par octet
  1449.     int count=256;
  1450.     int tot_nl=0;
  1451.     int lf_detected=0;
  1452.     int at_begining=1;
  1453.     do {
  1454.       nl=-1;
  1455.       count--;
  1456.       if (r->adr==NULL) {
  1457.         r->adr=(char*) malloct(8192);
  1458.         r->size=0;
  1459.       }
  1460.       if (r->adr!=NULL) {
  1461.         if (r->size < 8190) {
  1462.           // lecture
  1463.           nl = hts_read(r,r->adr+r->size,1);
  1464.           if (nl>0) {
  1465.             // exit if:
  1466.             // lf detected AND already detected before
  1467.             // or
  1468.             // lf detected AND first character read
  1469.             if (*(r->adr+r->size) == 10) {
  1470.               if (lf_detected || (at_begining) || (bufl<0))
  1471.                 count=-1;
  1472.               lf_detected=1;
  1473.             }
  1474.             if (*(r->adr+r->size) != 13) {   // sauter caractΦres 13
  1475.               if (
  1476.                 (*(r->adr+r->size) != 10)
  1477.                 &&
  1478.                 (*(r->adr+r->size) != 13)
  1479.                 ) {
  1480.                 // restart for new line
  1481.                 lf_detected=0;
  1482.               }
  1483.               (r->size)++;
  1484.               at_begining=0;
  1485.             }
  1486.             *(r->adr+r->size)='\0';    // terminer par octet nul
  1487.           }
  1488.         }
  1489.       }
  1490.       if (nl >= 0) {
  1491.         tot_nl+=nl;
  1492.         if (!check_readinput(r))
  1493.           count=-1;
  1494.       }
  1495.     } while((nl >= 0) && (count>0));
  1496.     nl = tot_nl;
  1497.   }
  1498. #if HDEBUG
  1499.   //printf("add to %d / %d\n",r->size,r->totalsize);
  1500. #endif
  1501.   // nl == 0 may mean "no relevant data", for example is using cache or ssl
  1502. #if HTS_USEOPENSSL
  1503.   if (r->ssl)
  1504.     return nl;
  1505.   else
  1506. #endif
  1507.     return ((nl > 0) ? nl : -1);        // ==0 is fatal if direct read
  1508. }
  1509.  
  1510.  
  1511. // teste une adresse, et suit l'Θventuel chemin "moved"
  1512. // retourne 200 ou le code d'erreur (404=NOT FOUND, etc)
  1513. // copie dans loc la vΘritable adresse si celle-ci est diffΘrente
  1514. htsblk http_location(char* adr,char* fil,char* loc) {
  1515.   htsblk retour;
  1516.   int retry=0;
  1517.   int tryagain;
  1518.   // note: "RFC says"
  1519.   // 5 boucles au plus, on en teste au plus 8 ici
  1520.   // sinon abandon..
  1521.   do {
  1522.     tryagain=0;
  1523.     switch ((retour=http_test(adr,fil,loc)).statuscode) {
  1524.     case 200: break;   // ok!
  1525.     case 301: case 302: case 303: case 307: // moved!
  1526.       // recalculer adr et fil!
  1527.       if (ident_url_absolute(loc,adr,fil)!=-1) {
  1528.         tryagain=1;  // retenter
  1529.         retry++;     // ..encore une fois
  1530.       }
  1531.     }
  1532.   } while((tryagain) && (retry<5+3));
  1533.   return retour;
  1534. }
  1535.  
  1536.  
  1537. // teste si une URL (validitΘ, header, taille)
  1538. // retourne 200 ou le code d'erreur (404=NOT FOUND, etc)
  1539. // en cas de moved xx, dans location
  1540. // abandonne dΘsormais au bout de 30 secondes (aurevoir les sites
  1541. // qui nous font poireauter 5 heures..) -> -2=timeout
  1542. htsblk http_test(char* adr,char* fil,char* loc) {
  1543.   T_SOC soc;
  1544.   htsblk retour;
  1545.   //int rcvsize=-1;
  1546.   //char* rcv=NULL;    // adresse de retour
  1547.   //int bufl=TAILLE_BUFFER;    // 8Ko de buffer
  1548.   TStamp tl;
  1549.   int timeout=30;  // timeout pour un check (arbitraire) // **
  1550.  
  1551.   // pour abandonner un site trop lent
  1552.   tl=time_local();
  1553.  
  1554.   loc[0]='\0';
  1555.   memset(&retour, 0, sizeof(htsblk));    // effacer
  1556.   retour.location=loc;    // si non nul, contiendra l'adresse vΘritable en cas de moved xx
  1557.  
  1558.   //soc=http_fopen(adr,fil,&retour,NULL);  // ouvrir, + header
  1559.  
  1560.   // on ouvre en head, et on traite l'en tΩte
  1561.   soc=http_xfopen(1,0,1,NULL,adr,fil,&retour);  // ouvrir HEAD, + envoi header
  1562.   
  1563.   if (soc!=INVALID_SOCKET) {
  1564.     int e=0;
  1565.     // tant qu'on a des donnΘes, et qu'on ne recoit pas deux LF, et que le timeout n'arrie pas
  1566.     do {
  1567.       if (http_xfread1(&retour,0) < 0)
  1568.         e=1;
  1569.       else {
  1570.         if (retour.adr!=NULL) {
  1571.           if ((retour.adr[retour.size-1]!=10) || (retour.adr[retour.size-2]!=10))
  1572.             e=1;
  1573.         }
  1574.       }
  1575.             
  1576.       if (!e) {
  1577.         if ((time_local()-tl)>=timeout) {
  1578.           e=-1;
  1579.         }
  1580.       }
  1581.       
  1582.     } while (!e);
  1583.     
  1584.     if (e==1) {
  1585.       if (adr!=NULL) {
  1586.         int ptr=0;
  1587.         char rcvd[1100];
  1588.  
  1589.         // note: en gros recopie du traitement de back_wait()
  1590.         //
  1591.  
  1592.  
  1593.         // ----------------------------------------
  1594.         // traiter en-tΩte!
  1595.         // status-line α rΘcupΘrer
  1596.         ptr+=binput(retour.adr+ptr,rcvd,1024);
  1597.         if (strnotempty(rcvd)==0)
  1598.           ptr+=binput(retour.adr+ptr,rcvd,1024);    // "certains serveurs buggΘs envoient un \n au dΘbut" (RFC)
  1599.         
  1600.         // traiter status-line
  1601.         treatfirstline(&retour,rcvd);
  1602.         
  1603. #if HDEBUG
  1604.         printf("(Buffer) Status-Code=%d\n",retour.statuscode);
  1605. #endif
  1606.         
  1607.         // en-tΩte
  1608.         
  1609.         // header // ** !attention! HTTP/0.9 non supportΘ
  1610.         do {
  1611.           ptr+=binput(retour.adr+ptr,rcvd,1024);          
  1612. #if HDEBUG
  1613.           printf("(buffer)>%s\n",rcvd);      
  1614. #endif
  1615.           if (strnotempty(rcvd))
  1616.             treathead(NULL,NULL,NULL,&retour,rcvd);  // traiter
  1617.           
  1618.         } while(strnotempty(rcvd));
  1619.         // ----------------------------------------                    
  1620.         
  1621.         // libΘrer mΘmoire
  1622.         if (retour.adr!=NULL) { freet(retour.adr); retour.adr=NULL; }
  1623.       }
  1624.     } else {
  1625.       retour.statuscode=-2;
  1626.       strcpy(retour.msg,"Timeout While Testing");
  1627.     }
  1628.     
  1629.     
  1630. #if HTS_DEBUG_CLOSESOCK
  1631.     DEBUG_W("http_test: deletehttp\n");
  1632. #endif
  1633.     deletehttp(&retour);
  1634.     retour.soc=INVALID_SOCKET;
  1635.   }
  1636.   return retour;    
  1637. }
  1638.  
  1639. // CrΘe un lien (http) vers une adresse internet iadr
  1640. // retour: structure (adresse, taille, message si erreur (si !adr))
  1641. // peut ouvrir avec des connect() non bloquants: waitconnect=0/1
  1642. int newhttp(char* _iadr,htsblk* retour,int port,int waitconnect) {  
  1643.   t_fullhostent fullhostent_buffer;    // buffer pour resolver
  1644.   T_SOC soc;                           // descipteur de la socket
  1645.   char* iadr;
  1646.   // unsigned short int port;
  1647.   
  1648.   // tester un Θventuel id:pass et virer id:pass@ si dΘtectΘ
  1649.   iadr = jump_identification(_iadr);
  1650.   
  1651.   // si iadr="#" alors c'est une fausse URL, mais un vrai fichier
  1652.   // local.
  1653.   // utile pour les tests!
  1654.   //## if (iadr[0]!=lOCAL_CHAR) {
  1655.   if (strcmp(iadr,"file://")) {           /* non fichier */
  1656.     SOCaddr server;
  1657.     int server_size=sizeof(server);
  1658.     t_hostent* hp;    
  1659.     // effacer structure
  1660.     memset(&server, 0, sizeof(server));
  1661.  
  1662. #if HDEBUG
  1663.     printf("gethostbyname\n");
  1664. #endif
  1665.     
  1666.     // tester un Θventuel port
  1667.     if (port==-1) {
  1668.       char *a=jump_toport(iadr);
  1669. #if HTS_USEOPENSSL
  1670.       if (retour->ssl)
  1671.         port=443;
  1672.       else
  1673.         port=80;    // port par dΘfaut
  1674. #else
  1675.       port=80;    // port par dΘfaut
  1676. #endif
  1677.       if (a) {
  1678.         char iadr2[HTS_URLMAXSIZE*2];
  1679.         int i=-1;
  1680.         iadr2[0]='\0';
  1681.         sscanf(a+1,"%d",&i);
  1682.         if (i!=-1) {
  1683.           port=(unsigned short int) i;
  1684.         }
  1685.         
  1686.         // adresse vΘritable (sans :xx)
  1687.         strncat(iadr2,iadr,(int) (a - iadr));
  1688.  
  1689.         // adresse sans le :xx
  1690.         hp = hts_gethostbyname(iadr2, &fullhostent_buffer);
  1691.         
  1692.       } else {
  1693.  
  1694.         // adresse normale (port par dΘfaut par la suite)
  1695.         hp = hts_gethostbyname(iadr, &fullhostent_buffer);
  1696.         
  1697.       }
  1698.       
  1699.     } else    // port dΘfini
  1700.       hp = hts_gethostbyname(iadr, &fullhostent_buffer);
  1701.  
  1702.     
  1703.     // Conversion iadr -> adresse
  1704.     // structure recevant le nom de l'h⌠te, etc
  1705.     //struct     hostent     *hp;
  1706.     if (hp == NULL) {
  1707. #if DEBUG
  1708.       printf("erreur gethostbyname\n");
  1709. #endif
  1710.       if (retour)
  1711.       if (retour->msg)
  1712.         strcpy(retour->msg,"Unable to get server's address");
  1713.       return INVALID_SOCKET;
  1714.     }  
  1715.     // copie adresse
  1716.     SOCaddr_copyaddr(server, server_size, hp->h_addr_list[0], hp->h_length);
  1717.     // memcpy(&SOCaddr_sinaddr(server), hp->h_addr_list[0], hp->h_length);
  1718.      
  1719.     // crΘer ("attachement") une socket (point d'accΦs) internet,en flot
  1720. #if HDEBUG
  1721.     printf("socket\n");
  1722. #endif
  1723. #if HTS_WIDE_DEBUG    
  1724.     DEBUG_W("socket\n");
  1725. #endif
  1726.     soc=socket(SOCaddr_sinfamily(server), SOCK_STREAM, 0);
  1727. #if HTS_WIDE_DEBUG    
  1728.     DEBUG_W("socket done\n");
  1729. #endif
  1730.     if (soc==INVALID_SOCKET) {
  1731.       if (retour)
  1732.       if (retour->msg)
  1733.         strcpy(retour->msg,"Unable to create a socket");
  1734.       return INVALID_SOCKET;                        // erreur crΘation socket impossible
  1735.     }
  1736.     // structure: connexion au domaine internet, port 80 (ou autre)
  1737.     SOCaddr_initport(server, port);
  1738. #if HDEBUG
  1739.     printf("==%d\n",soc);
  1740. #endif
  1741.  
  1742.     // connexion non bloquante?
  1743.     if (!waitconnect ) {
  1744.       unsigned long p=1;  // non bloquant
  1745. #if HTS_WIN
  1746.       ioctlsocket(soc,FIONBIO,&p);
  1747. #else
  1748.       ioctl(soc,FIONBIO,&p);
  1749. #endif
  1750.     }
  1751.     
  1752.     // Connexion au serveur lui mΩme
  1753. #if HDEBUG
  1754.     printf("connect\n");
  1755. #endif
  1756.     
  1757. #if HTS_WIDE_DEBUG
  1758.     DEBUG_W("connect\n");
  1759. #endif
  1760. #if HTS_WIN
  1761.     if (connect(soc, (const struct sockaddr FAR *)&server, server_size) != 0) {
  1762. #else
  1763.       if (connect(soc, (struct sockaddr *)&server, server_size) == -1) {
  1764. #endif
  1765.  
  1766.         // no - non blocking
  1767.         //deletesoc(soc);
  1768.         //soc=INVALID_SOCKET;
  1769.  
  1770.         // bloquant
  1771.         if (waitconnect) {
  1772. #if HDEBUG
  1773.           printf("unable to connect!\n");
  1774. #endif
  1775.           if (retour)
  1776.           if (retour->msg)
  1777.             strcpy(retour->msg,"Unable to connect to the server");
  1778.           /* Close the socket and notify the error!!! */
  1779.           deletesoc(soc);
  1780.           return INVALID_SOCKET;
  1781.         }
  1782.       }
  1783. #if HTS_WIDE_DEBUG    
  1784.       DEBUG_W("connect done\n");
  1785. #endif
  1786.       
  1787. #if HDEBUG
  1788.       printf("connexion Θtablie\n");
  1789. #endif
  1790.     
  1791.     // A partir de maintenant, on peut envoyer et recevoir des donnΘes
  1792.     // via le flot identifiΘ par soc (socket): write(soc,adr,taille) et 
  1793.     // read(soc,adr,taille)
  1794.  
  1795.   } else {    // on doit ouvrir un fichier local!
  1796.     // il sera gΘrΘ de la mΩme maniΦre qu'une socket (c'est idem!)
  1797.  
  1798.     soc=LOCAL_SOCKET_ID;    // pseudo-socket locale..
  1799.     // soc sera remplacΘ lors d'un http_fopen() par un handle vΘritable!
  1800.  
  1801.   }   // teste fichier local ou http
  1802.   
  1803.   return soc;
  1804. }
  1805.  
  1806.  
  1807.  
  1808. // couper http://www.truc.fr/pub/index.html -> www.truc.fr /pub/index.html
  1809. // retour=-1 si erreur.
  1810. // si file://... alors adresse=file:// (et coupe le ?query dans ce cas)
  1811. int ident_url_absolute(char* url,char* adr,char* fil) {
  1812.   int pos=0;
  1813.   int scheme=0;
  1814.  
  1815.   // effacer adr et fil
  1816.   adr[0]=fil[0]='\0';
  1817.   
  1818. #if HDEBUG
  1819.   printf("protocol: %s\n",url);
  1820. #endif
  1821.  
  1822.   // Scheme?
  1823.   {
  1824.     char* a=url;
  1825.     while (isalpha((unsigned char)*a))
  1826.       a++;
  1827.     if (*a == ':')
  1828.       scheme=1;
  1829.   }
  1830.  
  1831.   // 1. optional scheme ":"
  1832.   if ((pos=strfield(url,"file:"))) {    // fichier local!! (pour les tests)
  1833.     //!! p+=3;
  1834.     strcpy(adr,"file://");
  1835.   } else if ((pos=strfield(url,"http:"))) {    // HTTP
  1836.     //!!p+=3;
  1837.   } else if ((pos=strfield(url,"ftp:"))) {    // FTP
  1838.     strcpy(adr,"ftp://");    // FTP!!
  1839.     //!!p+=3;
  1840. #if HTS_USEOPENSSL
  1841.   } else if ((pos=strfield(url,"https:"))) {    // HTTPS
  1842.     strcpy(adr,"https://");
  1843. #endif
  1844.   } else if (scheme) {
  1845.     return -1;    // erreur non reconnu
  1846.   } else
  1847.     pos=0;
  1848.  
  1849.   // 2. optional "//" authority
  1850.   if (strncmp(url+pos,"//",2)==0)
  1851.     pos+=2;
  1852.  
  1853.   // (url+pos) now points to the path (not net path)
  1854.  
  1855.   //## if (adr[0]!=lOCAL_CHAR) {    // adresse normale http
  1856.   if (!strfield(adr,"file:")) {      // PAS file://
  1857.     char *p,*q;
  1858.     p=url+pos;
  1859.  
  1860.     // p pointe sur le dΘbut de l'adresse, ex: www.truc.fr/sommaire/index.html
  1861.     q=strchr(jump_identification(p),'/');
  1862.     if (q==0) q=strchr(jump_identification(p),'?');     // http://www.foo.com?bar=1
  1863.     if (q==0) q=p+strlen(p);  // pointe sur \0
  1864.     // q pointe sur le chemin, ex: index.html?query=recherche
  1865.     
  1866.     // chemin www... trop long!!
  1867.     if ( ( ((int) (q - p)) )  > HTS_URLMAXSIZE) {
  1868.       //strcpy(retour.msg,"Path too long");
  1869.       return -1;    // erreur
  1870.     }
  1871.     
  1872.     // recopier adresse www..
  1873.     strncat(adr,p, ((int) (q - p)) );
  1874.     // *( adr+( ((int) q) - ((int) p) ) )=0;  // faut arrΩter la fumette!
  1875.     // recopier chemin /pub/..
  1876.     if (q[0] != '/')    // page par dΘfaut (/)
  1877.       strcat(fil,"/");
  1878.     strcat(fil,q);
  1879.     // SECURITE:
  1880.     // simplifier url pour les ../
  1881.     fil_simplifie(fil);
  1882.   } else {    // localhost file://
  1883.     char *p;
  1884.     int i;
  1885.     char* a;
  1886.  
  1887.     p=url+pos;
  1888.     
  1889.     strcat(fil,p);    // fichier local ; adr="#"
  1890.     a=strchr(fil,'?');
  1891.     if (a) 
  1892.       *a='\0';      /* couper query (inutile pour file:// lors de la requΩte) */
  1893.     // filtrer les \\ -> / pour les fichiers DOS
  1894.     for(i=0;i<(int) strlen(fil);i++)
  1895.       if (fil[i]=='\\')
  1896.         fil[i]='/';
  1897.   }
  1898.  
  1899.   // no hostname
  1900.   if (!strnotempty(adr))
  1901.     return -1;    // erreur non reconnu
  1902.  
  1903.   // nommer au besoin.. (non utilisΘ normalement)
  1904.   if (!strnotempty(fil))
  1905.     strcpy(fil,"default-index.html");
  1906.  
  1907.   // case insensitive pour adresse
  1908.   {
  1909.     char *a=jump_identification(adr);
  1910.     while(*a) {
  1911.       if ((*a>='A') && (*a<='Z'))
  1912.         *a+='a'-'A';       
  1913.       a++;
  1914.     }
  1915.   }
  1916.   
  1917.   return 0;
  1918. }
  1919.  
  1920. // simplification des ../
  1921. void fil_simplifie(char* f) {
  1922.   int i=0;
  1923.   int last=0;
  1924.   char* a;
  1925.  
  1926.   // Θliminer ../
  1927.   while (f[i]) {
  1928.     
  1929.     if (f[i]=='/') {
  1930.       if (f[i+1]=='.')
  1931.       if (f[i+2]=='.')      // couper dernier rΘpertoire
  1932.       if (f[i+3]=='/')      // Θviter les /tmp/..coolandlamedir/
  1933.       {    // couper dernier rΘpertoire
  1934.         char tempo[HTS_URLMAXSIZE*2];
  1935.         tempo[0]='\0';
  1936.         //
  1937.         if (!last)                /* can't go upper.. */
  1938.           strcpy(tempo,"/");
  1939.         else
  1940.           strncpy(tempo,f,last+1);
  1941.         tempo[last+1]='\0';
  1942.         strcat(tempo,f+i+4);
  1943.         strcpy(f,tempo);    // remplacer
  1944.         i=-1;             // recommencer
  1945.         last=0;
  1946.       }
  1947.       
  1948.       if (i>=0)
  1949.         last=i;
  1950.       else
  1951.         last=0;
  1952.     }
  1953.     
  1954.     i++;
  1955.   }
  1956.  
  1957.   // Θliminer ./
  1958.   while ( (a=strstr(f,"./")) ) {
  1959.     char tempo[HTS_URLMAXSIZE*2];
  1960.     tempo[0]='\0';
  1961.     strcpy(tempo,a+2);
  1962.     strcpy(a,tempo);
  1963.   }
  1964.   // delete all remaining ../ (potential threat)
  1965.   while ( (a=strstr(f,"../")) ) {
  1966.     char tempo[HTS_URLMAXSIZE*2];
  1967.     tempo[0]='\0';
  1968.     strcpy(tempo,a+3);
  1969.     strcpy(a,tempo);
  1970.   }
  1971.   
  1972. }
  1973.  
  1974.  
  1975. // fermer liaison fichier ou socket
  1976. HTS_INLINE void deletehttp(htsblk* r) {
  1977. #if HTS_DEBUG_CLOSESOCK
  1978.     char info[256];
  1979.     sprintf(info,"deletehttp: (htsblk*) %d\n",r);
  1980.     DEBUG_W2(info);
  1981. #endif
  1982.   if (r->soc!=INVALID_SOCKET) {
  1983.     if (r->is_file) {
  1984.       if (r->fp)
  1985.         fclose(r->fp);
  1986.       r->fp=NULL;
  1987.     } else {
  1988.       if (r->soc!=LOCAL_SOCKET_ID)
  1989.         deletesoc_r(r);
  1990.     }
  1991.     r->soc=INVALID_SOCKET;
  1992.   }
  1993. }
  1994.  
  1995. // fermer une socket
  1996. HTS_INLINE void deletesoc(T_SOC soc) {
  1997.   if (soc!=INVALID_SOCKET) {
  1998. // J'ai plantΘ.. pas de shutdown
  1999. //#if HTS_WIDE_DEBUG    
  2000. //    DEBUG_W("shutdown\n");
  2001. //#endif
  2002. //    shutdown(soc,2);  // shutdown
  2003. //#if HTS_WIDE_DEBUG    
  2004. //    DEBUG_W("shutdown done\n");
  2005. //#endif
  2006.     // Ne pas oublier de fermer la connexion avant de partir.. (plus propre)
  2007. #if HTS_WIDE_DEBUG    
  2008.     DEBUG_W("close\n");
  2009. #endif
  2010. #if HTS_WIN
  2011.     closesocket(soc);
  2012. #else
  2013.     close(soc);
  2014. #endif
  2015. #if HTS_WIDE_DEBUG    
  2016.     DEBUG_W("close done\n");
  2017. #endif
  2018.   }
  2019. }
  2020.  
  2021. /* Will also clean other things */
  2022. HTS_INLINE void deletesoc_r(htsblk* r) {
  2023. #if HTS_USEOPENSSL
  2024.   if (r->ssl_con) {
  2025.     SSL_shutdown(r->ssl_con);
  2026.     // SSL_CTX_set_quiet_shutdown(r->ssl_con->ctx, 1);
  2027.     SSL_free(r->ssl_con);
  2028.     r->ssl_con=NULL;
  2029.   }
  2030. #endif
  2031.   deletesoc(r->soc);
  2032.   r->soc=INVALID_SOCKET;
  2033. }
  2034.  
  2035. // renvoi le nombre de secondes depuis 1970
  2036. HTS_INLINE TStamp time_local(void) {
  2037.   return ((TStamp) time(NULL));
  2038. }
  2039.  
  2040. // number of millisec since 1970
  2041. HTS_INLINE TStamp mtime_local(void) {
  2042. #ifndef HTS_DO_NOT_USE_FTIME
  2043.   struct timeb B;
  2044.   ftime( &B );
  2045.   return (TStamp) ( ((TStamp) B.time * (TStamp) 1000)
  2046.         + ((TStamp) B.millitm) );
  2047. #else
  2048.   // not precise..
  2049.   return (TStamp) ( ((TStamp) time_local() * (TStamp) 1000)
  2050.         + ((TStamp) 0) );
  2051. #endif
  2052. }
  2053.  
  2054. // convertit un nombre de secondes en temps (chaine)
  2055. void sec2str(char *st,TStamp t) {
  2056.   int j,h,m,s;
  2057.   
  2058.   j=(int) (t/(3600*24));
  2059.   t-=((TStamp) j)*(3600*24);
  2060.   h=(int) (t/(3600));
  2061.   t-=((TStamp) h)*3600;
  2062.   m=(int) (t/60);
  2063.   t-=((TStamp) m)*60;
  2064.   s=(int) t;
  2065.   
  2066.   if (j>0)
  2067.     sprintf(st,"%d days, %d hours %d minutes %d seconds",j,h,m,s);
  2068.   else if (h>0)
  2069.     sprintf(st,"%d hours %d minutes %d seconds",h,m,s);
  2070.   else if (m>0)
  2071.     sprintf(st,"%d minutes %d seconds",m,s);
  2072.   else
  2073.     sprintf(st,"%d seconds",s);
  2074. }
  2075.  
  2076. // idem, plus court (chaine)
  2077. void qsec2str(char *st,TStamp t) {
  2078.   int j,h,m,s;
  2079.   
  2080.   j=(int) (t/(3600*24));
  2081.   t-=((TStamp) j)*(3600*24);
  2082.   h=(int) (t/(3600));
  2083.   t-=((TStamp) h)*3600;
  2084.   m=(int) (t/60);
  2085.   t-=((TStamp) m)*60;
  2086.   s=(int) t;
  2087.   
  2088.   if (j>0)
  2089.     sprintf(st,"%dd,%02dh,%02dmin%02ds",j,h,m,s);
  2090.   else if (h>0)
  2091.     sprintf(st,"%dh,%02dmin%02ds",h,m,s);
  2092.   else if (m>0)
  2093.     sprintf(st,"%dmin%02ds",m,s);
  2094.   else
  2095.     sprintf(st,"%ds",s);
  2096. }
  2097.  
  2098.  
  2099. // heure actuelle, GMT, format rfc (taille buffer 256o)
  2100. void time_gmt_rfc822(char* s) {
  2101.   time_t tt;
  2102.   struct tm* A;
  2103.   tt=time(NULL);
  2104.   A=gmtime(&tt);
  2105.   if (A==NULL)
  2106.     A=localtime(&tt);
  2107.   time_rfc822(s,A);
  2108. }
  2109.  
  2110. // heure actuelle, format rfc (taille buffer 256o)
  2111. void time_local_rfc822(char* s) {
  2112.   time_t tt;
  2113.   struct tm* A;
  2114.   tt=time(NULL);
  2115.   A=localtime(&tt);
  2116.   time_rfc822_local(s,A);
  2117. }
  2118.  
  2119. /* convertir une chaine en temps */
  2120. struct tm* convert_time_rfc822(char* s) {
  2121.   struct tm* result;
  2122.   /* */
  2123.   char months[]="jan feb mar apr may jun jul aug sep oct nov dec";
  2124.   char str[256];
  2125.   char* a;
  2126.   /* */
  2127.   int result_mm=-1;
  2128.   int result_dd=-1;
  2129.   int result_n1=-1;
  2130.   int result_n2=-1;
  2131.   int result_n3=-1;
  2132.   int result_n4=-1;
  2133.   /* */
  2134.   NOSTATIC_RESERVE(result, struct tm, 1);
  2135.  
  2136.   if ((int) strlen(s) > 200)
  2137.     return NULL;
  2138.   strcpy(str,s);
  2139.   hts_lowcase(str);
  2140.   /* Θliminer :,- */
  2141.   while( (a=strchr(str,'-')) ) *a=' ';
  2142.   while( (a=strchr(str,':')) ) *a=' ';
  2143.   while( (a=strchr(str,',')) ) *a=' ';
  2144.   /* tokeniser */
  2145.   a=str;
  2146.   while(*a) {
  2147.     char *first,*last;
  2148.     char tok[256];
  2149.     /* dΘcouper mot */
  2150.     while(*a==' ') a++;   /* sauter espaces */
  2151.     first=a;
  2152.     while((*a) && (*a!=' ')) a++;
  2153.     last=a;
  2154.     tok[0]='\0';
  2155.     if (first!=last) {
  2156.       char* pos;
  2157.       strncat(tok,first,(int) (last - first));
  2158.       /* analyser */
  2159.       if ( (pos=strstr(months,tok)) ) {               /* month always in letters */
  2160.         result_mm=((int) (pos - months))/4;
  2161.       } else {
  2162.         int number;
  2163.         if (sscanf(tok,"%d",&number) == 1) {      /* number token */
  2164.           if (result_dd<0)                        /* day always first number */
  2165.             result_dd=number;
  2166.           else if (result_n1<0)
  2167.             result_n1=number;
  2168.           else if (result_n2<0)
  2169.             result_n2=number;
  2170.           else if (result_n3<0)
  2171.             result_n3=number;
  2172.           else if (result_n4<0)
  2173.             result_n4=number;
  2174.         }   /* sinon, bruit de fond(+1GMT for exampel) */
  2175.       }
  2176.     }
  2177.   }
  2178.   if ((result_n1>=0) && (result_mm>=0) && (result_dd>=0) && (result_n2>=0) && (result_n3>=0) && (result_n4>=0)) {
  2179.     if (result_n4>=1000) {               /* Sun Nov  6 08:49:37 1994 */
  2180.       result->tm_year=result_n4-1900;
  2181.       result->tm_hour=result_n1;
  2182.       result->tm_min=result_n2;
  2183.       result->tm_sec=max(result_n3,0);
  2184.     } else {                            /* Sun, 06 Nov 1994 08:49:37 GMT or Sunday, 06-Nov-94 08:49:37 GMT */
  2185.       result->tm_hour=result_n2;
  2186.       result->tm_min=result_n3;
  2187.       result->tm_sec=max(result_n4,0);
  2188.       if (result_n1<=50)                /* 00 means 2000 */
  2189.         result->tm_year=result_n1+100;
  2190.       else if (result_n1<1000)          /* 99 means 1999 */
  2191.         result->tm_year=result_n1;
  2192.       else                              /* 2000 */
  2193.         result->tm_year=result_n1-1900;
  2194.     }
  2195.     result->tm_isdst=0;        /* assume GMT */
  2196.     result->tm_yday=-1;        /* don't know */
  2197.     result->tm_wday=-1;        /* don't know */
  2198.     result->tm_mon=result_mm;
  2199.     result->tm_mday=result_dd;
  2200.     return result;
  2201.   }
  2202.   return NULL;
  2203. }
  2204.  
  2205. /* sets file time. -1 if error */
  2206. int set_filetime(char* file,struct tm* tm_time) {
  2207.   struct utimbuf tim;
  2208. #ifndef HTS_DO_NOT_USE_FTIME
  2209.   struct timeb B;
  2210.   B.timezone=0;
  2211.   ftime( &B );
  2212.   tim.actime=tim.modtime=mktime(tm_time) - B.timezone*60; 
  2213. #else
  2214.   // bogus time (GMT/local)..
  2215.   tim.actime=tim.modtime=mktime(tm_time); 
  2216. #endif
  2217.   return utime(file,&tim);
  2218. }
  2219.  
  2220. /* sets file time from RFC822 date+time, -1 if error*/
  2221. int set_filetime_rfc822(char* file,char* date) {
  2222.   struct tm* tm_s=convert_time_rfc822(date);
  2223.   if (tm_s) {
  2224.     return set_filetime(file,tm_s);
  2225.   } else return -1;
  2226. }
  2227.  
  2228.  
  2229. // heure au format rfc (taille buffer 256o)
  2230. HTS_INLINE void time_rfc822(char* s,struct tm * A) {
  2231.   strftime(s,256,"%a, %d %b %Y %H:%M:%S GMT",A);
  2232. }
  2233.  
  2234. // heure locale au format rfc (taille buffer 256o)
  2235. HTS_INLINE void time_rfc822_local(char* s,struct tm * A) {
  2236.   strftime(s,256,"%a, %d %b %Y %H:%M:%S",A);
  2237. }
  2238.  
  2239. // conversion en b,Kb,Mb
  2240. char* int2bytes(LLint n) {
  2241.   char** a=int2bytes2(n);
  2242.   char* buff;
  2243.   NOSTATIC_RESERVE(buff, char, 256);
  2244.  
  2245.   strcpy(buff,a[0]);
  2246.   strcat(buff,a[1]);
  2247.   return concat(buff,"");
  2248. }
  2249.  
  2250. // conversion en b/s,Kb/s,Mb/s
  2251. char* int2bytessec(long int n) {
  2252.   char* buff;
  2253.   char** a=int2bytes2(n);
  2254.   NOSTATIC_RESERVE(buff, char, 256);
  2255.  
  2256.   strcpy(buff,a[0]);
  2257.   strcat(buff,a[1]);
  2258.   return concat(buff,"/s");
  2259. }
  2260. char* int2char(int n) {
  2261.   char* buffer;
  2262.   NOSTATIC_RESERVE(buffer, char, 32);
  2263.   sprintf(buffer,"%d",n);
  2264.   return concat(buffer,"");
  2265. }
  2266.  
  2267. // conversion en b,Kb,Mb, nombre et type sΘparΘs
  2268. // limite: 2.10^9.10^6B
  2269.  
  2270. /* See http://physics.nist.gov/cuu/Units/binary.html */
  2271. #define ToLLint(a) ((LLint)(a))
  2272. #define ToLLintKiB (ToLLint(1024))
  2273. #define ToLLintMiB (ToLLintKiB*ToLLintKiB)
  2274. #ifdef HTS_LONGLONG
  2275. #define ToLLintGiB (ToLLintKiB*ToLLintKiB*ToLLintKiB)
  2276. #define ToLLintTiB (ToLLintKiB*ToLLintKiB*ToLLintKiB*ToLLintKiB)
  2277. #define ToLLintPiB (ToLLintKiB*ToLLintKiB*ToLLintKiB*ToLLintKiB*ToLLintKiB)
  2278. #endif
  2279. typedef struct {
  2280.   char buff1[256];
  2281.   char buff2[32];
  2282.   char* buffadr[2];
  2283. } strc_int2bytes2;
  2284. char** int2bytes2(LLint n) {
  2285.   strc_int2bytes2* strc;
  2286.   NOSTATIC_RESERVE(strc, strc_int2bytes2, 1);
  2287.  
  2288.   if (n < ToLLintKiB) {
  2289.     sprintf(strc->buff1,"%d",(int)(LLint)n);
  2290.     strcpy(strc->buff2,"B");
  2291.   } else if (n < ToLLintMiB) {
  2292.     sprintf(strc->buff1,"%d,%02d",(int)((LLint)(n/ToLLintKiB)),(int)((LLint)((n%ToLLintKiB)*100)/ToLLintKiB));
  2293.     strcpy(strc->buff2,"KiB");
  2294.   }
  2295. #ifdef HTS_LONGLONG
  2296.   else if (n < ToLLintGiB) {
  2297.     sprintf(strc->buff1,"%d,%02d",(int)((LLint)(n/(ToLLintMiB))),(int)((LLint)(((n%(ToLLintMiB))*100)/(ToLLintMiB))));
  2298.     strcpy(strc->buff2,"MiB");
  2299.   } else if (n < ToLLintTiB) {
  2300.     sprintf(strc->buff1,"%d,%02d",(int)((LLint)(n/(ToLLintGiB))),(int)((LLint)(((n%(ToLLintGiB))*100)/(ToLLintGiB))));
  2301.     strcpy(strc->buff2,"GiB");
  2302.   } else if (n < ToLLintPiB) {
  2303.     sprintf(strc->buff1,"%d,%02d",(int)((LLint)(n/(ToLLintTiB))),(int)((LLint)(((n%(ToLLintTiB))*100)/(ToLLintTiB))));
  2304.     strcpy(strc->buff2,"TiB");
  2305.   } else {
  2306.     sprintf(strc->buff1,"%d,%02d",(int)((LLint)(n/(ToLLintPiB))),(int)((LLint)(((n%(ToLLintPiB))*100)/(ToLLintPiB))));
  2307.     strcpy(strc->buff2,"PiB");
  2308.   }
  2309. #else
  2310.   else {
  2311.     sprintf(strc->buff1,"%d,%02d",(int)((LLint)(n/(ToLLintMiB))),(int)((LLint)(((n%(ToLLintMiB))*100)/(ToLLintMiB))));
  2312.     strcpy(strc->buff2,"MiB");
  2313.   }
  2314. #endif
  2315.   strc->buffadr[0]=strc->buff1;
  2316.   strc->buffadr[1]=strc->buff2;
  2317.   return strc->buffadr;
  2318. }
  2319.  
  2320. #if HTS_WIN
  2321. #else
  2322. // ignore sigpipe?
  2323. int sig_ignore_flag( int setflag ) {     // flag ignore
  2324.   static int flag=0;   /* YES, this one is true static */
  2325.   if (setflag>=0)
  2326.     flag=setflag;
  2327.   return flag;
  2328. }
  2329. #endif
  2330.  
  2331. // envoi de texte (en tΩtes gΘnΘralement) sur la socket soc
  2332. HTS_INLINE int sendc(htsblk* r, char* s) {
  2333.   int n;
  2334.  
  2335. #if HTS_WIN
  2336. #else
  2337.   sig_ignore_flag(1);
  2338. #endif
  2339. #if HDEBUG
  2340.   write(0,s,strlen(s));
  2341. #endif
  2342.  
  2343. #if HTS_USEOPENSSL
  2344.   if (r->ssl) {
  2345.     n = SSL_write(r->ssl_con, s, strlen(s));
  2346.   } else
  2347. #endif
  2348.     n = send(r->soc,s,strlen(s),0);
  2349.  
  2350. #if HTS_WIN
  2351. #else
  2352.   sig_ignore_flag(0);
  2353. #endif
  2354.  
  2355.   return n;
  2356. }
  2357.  
  2358.  
  2359. // Remplace read
  2360. void finput(int fd,char* s,int max) {
  2361.   char c;
  2362.   int j=0;
  2363.   do {
  2364.     //c=fgetc(fp);
  2365.     if (read(fd,&c,1)<=0) {
  2366.       c=0;
  2367.     }
  2368.     if (c!=0) {
  2369.       switch(c) {
  2370.       case 10: c=0; break;
  2371.       case 13: break;  // sauter ces caractΦres
  2372.       default: s[j++]=c; break;
  2373.       }
  2374.     }
  2375.   }  while((c!=0) && (j<max-1));
  2376.   s[j++]='\0';
  2377.  
  2378. // Like linput, but in memory (optimized)
  2379. int binput(char* buff,char* s,int max) {
  2380.   char* end;
  2381.   int count;
  2382.  
  2383.   // clear buffer
  2384.   s[0]='\0';
  2385.   // end of buffer?
  2386.   if ( *buff == '\0')
  2387.     return 0;
  2388.   // find ending \n
  2389.   end=strchr(buff,'\n');
  2390.   // ..or end of buffer
  2391.   if (!end)
  2392.     end=buff+strlen(buff);
  2393.   // then count number of bytes, maximum=max
  2394.   count=min(max,end-buff);
  2395.   // and strip annoying ending cr
  2396.   while( (count>0) && (buff[count] == '\r'))
  2397.     count--;
  2398.   // copy
  2399.   memcpy(s, buff, count);        // strncat(s,buff,count);
  2400.   // and terminate with a null char
  2401.   s[count]='\0';
  2402.   // then return the supplemental jump offset
  2403.   return (end-buff)+1;
  2404.  
  2405. // Lecture d'une ligne (peut Ωtre unicode α priori)
  2406. int linput(FILE* fp,char* s,int max) {
  2407.   int c;
  2408.   int j=0;
  2409.   do {
  2410.     c=fgetc(fp);
  2411.     if (c!=EOF) {
  2412.       switch(c) {
  2413.         case 13: break;  // sauter CR
  2414.         case 10: c=-1; break;
  2415.         case 9: case 12: break;  // sauter ces caractΦres
  2416.         default: s[j++]=(char) c; break;
  2417.       }
  2418.     }
  2419.   }  while((c!=-1) && (c!=EOF) && (j<(max-1)));
  2420.   s[j]='\0';
  2421.   return j;
  2422. }
  2423. int linput_trim(FILE* fp,char* s,int max) {
  2424.   int rlen=0;
  2425.   char* ls=(char*) malloct(max+2);
  2426.   s[0]='\0';
  2427.   if (ls) {
  2428.     char* a;
  2429.     // lire ligne
  2430.     rlen=linput(fp,ls,max);
  2431.     if (rlen) {
  2432.       // sauter espaces et tabs en fin
  2433.       while( (rlen>0) && ((ls[max(rlen-1,0)]==' ') || (ls[max(rlen-1,0)]=='\t')) )
  2434.         ls[--rlen]='\0';
  2435.       // sauter espaces en dΘbut
  2436.       a=ls;
  2437.       while((rlen>0) && ((*a==' ') || (*a=='\t'))) {
  2438.         a++;
  2439.         rlen--;
  2440.       }
  2441.       if (rlen>0) {
  2442.         memcpy(s,a,rlen);      // can copy \0 chars
  2443.         s[rlen]='\0';
  2444.       }
  2445.     }
  2446.     //
  2447.     freet(ls);
  2448.   }
  2449.   return rlen;
  2450. }
  2451. int linput_cpp(FILE* fp,char* s,int max) {
  2452.   int rlen=0;
  2453.   s[0]='\0';
  2454.   do {
  2455.     int ret;
  2456.     if (rlen>0)
  2457.     if (s[rlen-1]=='\\')
  2458.       s[--rlen]='\0';      // couper \ final
  2459.     // lire ligne
  2460.     ret=linput_trim(fp,s+rlen,max-rlen);
  2461.     if (ret>0)
  2462.       rlen+=ret;
  2463.   } while((s[max(rlen-1,0)]=='\\') && (rlen<max));
  2464.   return rlen;
  2465. }
  2466.  
  2467. // idem avec les car spΘciaux
  2468. void rawlinput(FILE* fp,char* s,int max) {
  2469.   int c;
  2470.   int j=0;
  2471.   do {
  2472.     c=fgetc(fp);
  2473.     if (c!=EOF) {
  2474.       switch(c) {
  2475.         case 13: break;  // sauter CR
  2476.         case 10: c=-1; break;
  2477.         default: s[j++]=(char) c; break;
  2478.       }
  2479.     }
  2480.   }  while((c!=-1) && (c!=EOF) && (j<(max-1)));
  2481.   s[j++]='\0';
  2482. }
  2483.  
  2484.  
  2485. // compare le dΘbut de f avec s et retourne la position de la fin
  2486. // 'A=a' (case insensitive)
  2487. int strfield(const char* f,const char* s) {
  2488.   int r=0;
  2489.   while (streql(*f,*s) && ((*f)!=0) && ((*s)!=0)) { f++; s++; r++; }
  2490.   if (*s==0)
  2491.     return r;
  2492.   else
  2493.     return 0;
  2494. }
  2495.  
  2496. //cherche chaine, case insensitive
  2497. char* strstrcase(char *s,char *o) {
  2498.   while((*s) && (strfield(s,o)==0)) s++;
  2499.   if (*s=='\0') return NULL;
  2500.   return s;  
  2501. }
  2502.  
  2503.  
  2504. // Unicode detector
  2505. // See http://www.unicode.org/unicode/reports/tr28/
  2506. // (sect Table 3.1B. Legal UTF-8 Byte Sequences)
  2507. typedef struct {
  2508.   unsigned int pos;
  2509.   unsigned char data[4];
  2510. } t_auto_seq;
  2511.  
  2512. // char between a and b
  2513. #define CHAR_BETWEEN(c, a, b)       ( (c) >= 0x##a ) && ( (c) <= 0x##b )
  2514. // sequence start
  2515. #define SEQBEG                      ( inseq == 0 )
  2516. // in this block
  2517. #define BLK(n,a, b)                 ( (seq.pos >= n) && ((err = CHAR_BETWEEN(seq.data[n], a, b))) )
  2518. #define ELT(n,a)                    BLK(n,a,a)
  2519. // end
  2520. #define SEQEND                      ((ok = 1))
  2521. // sequence started, character will fail if error
  2522. #define IN_SEQ                      ( (inseq = 1) )
  2523. // decoding error
  2524. #define BAD_SEQ                     ( (ok == 0) && (inseq != 0) && (!err) )
  2525. // no sequence started
  2526. #define NO_SEQ                      ( inseq == 0 )
  2527.  
  2528. // is this block an UTF unicode textfile?
  2529. // 0 : no
  2530. // 1 : yes
  2531. // -1: don't know
  2532. int is_unicode_utf8(unsigned char* buffer, unsigned int size) {
  2533.   t_auto_seq seq;
  2534.   unsigned int i;
  2535.   int is_utf=-1;
  2536.  
  2537.   seq.pos=0;
  2538.   for(i=0 ; i < size ; i++) {
  2539.     unsigned int ok=0;
  2540.     unsigned int inseq=0;
  2541.     unsigned int err=0;
  2542.  
  2543.     seq.data[seq.pos]=buffer[i];
  2544.     /**/ if ( SEQBEG && BLK(0,00,7F) && IN_SEQ && SEQEND                                                 ) { }
  2545.     else if ( SEQBEG && BLK(0,C2,DF) && IN_SEQ && BLK(1,80,BF) && SEQEND                                 ) { }
  2546.     else if ( SEQBEG && ELT(0,E0   ) && IN_SEQ && BLK(1,A0,BF) && BLK(2,80,BF) && SEQEND                 ) { }
  2547.     else if ( SEQBEG && BLK(0,E1,EC) && IN_SEQ && BLK(1,80,BF) && BLK(2,80,BF) && SEQEND                 ) { }
  2548.     else if ( SEQBEG && ELT(0,ED   ) && IN_SEQ && BLK(1,80,9F) && BLK(2,80,BF) && SEQEND                 ) { }
  2549.     else if ( SEQBEG && BLK(0,EE,EF) && IN_SEQ && BLK(1,80,BF) && BLK(2,80,BF) && SEQEND                 ) { }
  2550.     else if ( SEQBEG && ELT(0,F0   ) && IN_SEQ && BLK(1,90,BF) && BLK(2,80,BF) && BLK(3,80,BF) && SEQEND ) { }
  2551.     else if ( SEQBEG && BLK(0,F1,F3) && IN_SEQ && BLK(1,80,BF) && BLK(2,80,BF) && BLK(3,80,BF) && SEQEND ) { }
  2552.     else if ( SEQBEG && ELT(0,F4   ) && IN_SEQ && BLK(1,80,8F) && BLK(2,80,BF) && BLK(3,80,BF) && SEQEND ) { }
  2553.     else if ( NO_SEQ ) {    // bad, unknown
  2554.       return 0;
  2555.     }
  2556.     /* */
  2557.     
  2558.     /* Error */
  2559.     if ( BAD_SEQ ) {
  2560.       return 0;
  2561.     }
  2562.  
  2563.     /* unicode character */
  2564.     if (seq.pos > 0)
  2565.       is_utf=1;
  2566.  
  2567.     /* Next */
  2568.     if (ok)
  2569.       seq.pos=0;
  2570.     else
  2571.       seq.pos++;
  2572.  
  2573.     /* Internal error */
  2574.     if (seq.pos >= 4)
  2575.       return 0;
  2576.  
  2577.   }
  2578.  
  2579.   return is_utf;
  2580. }
  2581.  
  2582.  
  2583. // le fichier est-il un fichier html?
  2584. //  0 : non
  2585. //  1 : oui
  2586. // -1 : on sait pas
  2587. // -2 : on sait pas, pas d'extension
  2588. int ishtml(char* fil) {
  2589.   char *a;
  2590.  
  2591.   // patch pour les truc.html?Choix=toto
  2592.   if ( (a=strchr(fil,'?')) )  // paramΦtres?
  2593.     a--;  // pointer juste avant le ?
  2594.   else
  2595.     a=fil+strlen(fil)-1;  // pointer sur le dernier caractΦre
  2596.  
  2597.   if (*a=='/') return -1;    // rΘpertoire, on sait pas!!
  2598.   //if (*a=='/') return 1;    // ok rΘpertoire, html
  2599.  
  2600.   while ( (*a!='.') && (*a!='/')  && ( a > fil)) a--;
  2601.   if (*a=='.') {  // a une extension
  2602.     char fil_noquery[HTS_URLMAXSIZE*2];
  2603.     fil_noquery[0]='\0';
  2604.     a++;  // pointer sur extension
  2605.     strncat(fil_noquery,a,HTS_URLMAXSIZE);
  2606.     a=strchr(fil_noquery,'?');
  2607.     if (a)
  2608.       *a='\0';
  2609.     return ishtml_ext(fil_noquery);     // retour
  2610.   } else return -2;   // indΘterminΘ, par exemple /truc
  2611. }
  2612.  
  2613. // idem, mais pour uniquement l'extension
  2614. int ishtml_ext(char* a) {
  2615.   int html=0;  
  2616.   //
  2617.   if (strfield2(a,"html"))       html = 1;
  2618.   else if (strfield2(a,"htm"))   html = 1;
  2619.   else if (strfield2(a,"shtml")) html = 1;
  2620.   else if (strfield2(a,"phtml")) html = 1;
  2621.   else if (strfield2(a,"htmlx")) html = 1;
  2622.   else if (strfield2(a,"shtm"))  html = 1;
  2623.   else if (strfield2(a,"phtm"))  html = 1;
  2624.   else if (strfield2(a,"htmx"))  html = 1;
  2625.   //
  2626.   // insuccΦs..
  2627.   else {
  2628.     switch(is_knowntype(a)) {
  2629.     case 1:
  2630.       html = 0;     // connu, non html
  2631.       break;
  2632.     case 2:
  2633.       html = 1;     // connu, html
  2634.       break;
  2635.     default:
  2636.       html = -1;    // inconnu..
  2637.       break;
  2638.     }
  2639.   }
  2640.   return html;  
  2641. }
  2642.  
  2643. // error (404,500..)
  2644. HTS_INLINE int ishttperror(int err) {
  2645.   switch (err/100) {
  2646.     case 4: case 5: return 1;
  2647.       break;
  2648.   }
  2649.   return 0;
  2650. }
  2651.  
  2652.  
  2653. // retourne le pointeur ou le pointeur + offset si il existe dans la chaine un @ signifiant 
  2654. // une identification
  2655. char* jump_identification(char* source) {
  2656.   char *a,*trytofind;
  2657.   // rechercher dernier @ (car parfois email transmise dans adresse!)
  2658.   // mais sauter ftp:// Θventuel
  2659.   a = jump_protocol(source);
  2660.   trytofind = strrchr_limit(a, '@', strchr(a,'/'));
  2661.   return (trytofind != NULL)?trytofind:a;
  2662. }
  2663.  
  2664. // find port (:80) or NULL if not found
  2665. // can handle IPV6 addresses
  2666. char* jump_toport(char* source) {
  2667.   char *a,*trytofind;
  2668.   a = jump_identification(source);
  2669.   trytofind = strrchr_limit(a, ']', strchr(source, '/'));    // find last ] (http://[3ffe:b80:1234::1]:80/foo.html)
  2670.   a = strchr( (trytofind)?trytofind:a, ':');
  2671.   return a;
  2672. }
  2673.  
  2674. // strrchr, but not too far
  2675. char* strrchr_limit(char* s, char c, char* limit) {
  2676.   if (limit == NULL) {
  2677.     char* p = strchr(s, c);
  2678.     return p?(p+1):NULL;
  2679.   } else {
  2680.     char *a=NULL, *p;
  2681.     for(;;) {
  2682.       p=strchr((a)?a:s, c);
  2683.       if ((p >= limit) || (p == NULL))
  2684.         return a;
  2685.       a=p+1;
  2686.     }
  2687.   }
  2688. }
  2689.  
  2690. // retourner adr sans ftp://
  2691. HTS_INLINE char* jump_protocol(char* source) {
  2692.   int p;
  2693.   // scheme
  2694.   // "Comparisons of scheme names MUST be case-insensitive" (RFC2616)
  2695.   if ((p=strfield(source,"http:")))
  2696.     source+=p;
  2697.   else if ((p=strfield(source,"ftp:")))
  2698.     source+=p;
  2699. #if HTS_USEOPENSSL
  2700.   else if ((p=strfield(source,"https:")))
  2701.     source+=p;
  2702. #endif
  2703.   // net_path
  2704.   if (strncmp(source,"//",2)==0)
  2705.     source+=2;
  2706.   return source;
  2707. }
  2708.  
  2709. // codage base 64 a vers b
  2710. void code64(char* a,char* b) {
  2711.   int i1=0,i2=0,i3=0,i4=0;
  2712.   unsigned long store;
  2713.   int n;
  2714.   const char _hts_base64[] = "ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz0123456789+/";
  2715.   b[0]='\0';
  2716.   while(*a) {  
  2717.     // 24 bits
  2718.     n=1; store=0; store |= ((*a++) & 0xff);
  2719.     if (*a) { n=2; store <<= 8; store |= ((*a++) & 0xff); }
  2720.     if (*a) { n=3; store <<= 8; store |= ((*a++) & 0xff); }
  2721.     if (n==3) {
  2722.       i4=store & 63;
  2723.       i3=(store>>6) & 63;
  2724.       i2=(store>>12) & 63;
  2725.       i1=(store>>18) & 63;
  2726.     } else if (n==2) {
  2727.       store<<=2;    
  2728.       i3=store & 63;
  2729.       i2=(store>>6) & 63;
  2730.       i1=(store>>12) & 63;
  2731.     } else {
  2732.       store<<=4;
  2733.       i2=store & 63;
  2734.       i1=(store>>6) & 63;
  2735.     }
  2736.     
  2737.     *b++ = _hts_base64[i1];
  2738.     *b++ = _hts_base64[i2];
  2739.     if (n>=2)
  2740.       *b++ = _hts_base64[i3];
  2741.     else
  2742.       *b++ = '=';
  2743.     if (n>=3)
  2744.       *b++ = _hts_base64[i4];
  2745.     else
  2746.       *b++ = '=';
  2747.   }
  2748.   *b++='\0';
  2749. }
  2750.  
  2751. // remplacer " par " etc..
  2752. // buffer MAX 1Ko
  2753. void unescape_amp(char* s) {
  2754.   while(*s) {
  2755.     if (*s=='&') {
  2756.       char* end=strchr(s,';');
  2757.       if ( ((int) (end - s)) <= 8) {
  2758.         char c=0;
  2759.         if (strfield(s,"&"))
  2760.           c='&';
  2761.         else if (strfield(s,"°"))
  2762.           c='░';
  2763.         else if (strfield(s,">"))
  2764.           c='>';
  2765.         else if (strfield(s,"«"))
  2766.           c='\"';
  2767.         else if (strfield(s,"<"))
  2768.           c='<';
  2769.         else if (strfield(s," "))
  2770.           c=' ';
  2771.         else if (strfield(s,"""))
  2772.           c='\"';
  2773.         else if (strfield(s,"»"))
  2774.           c='\"';
  2775.         else if (strfield(s,"­"))
  2776.           c='-';
  2777.         else if (strfield(s,"˜"))
  2778.           c='~';
  2779.         else if (strfield(s,"&"))
  2780.           c='&';
  2781.         // remplacer?
  2782.         if (c) {
  2783.           char buff[HTS_URLMAXSIZE*2];
  2784.           buff[0]=c;
  2785.           strcpy(buff+1,end+1);
  2786.           strcpy(s,buff);
  2787.         }
  2788.       }
  2789.     }
  2790.     s++;
  2791.   }
  2792. }
  2793.  
  2794. // remplacer %20 par ' ', | par : etc..
  2795. // buffer MAX 1Ko
  2796. char* unescape_http(char* s) {
  2797.   char* tempo;
  2798.   int i,j=0;
  2799.   NOSTATIC_RESERVE(tempo, char, HTS_URLMAXSIZE*2);
  2800.   for (i=0;i<(int) strlen(s);i++) {
  2801.     if (s[i]=='%') {
  2802.       i++;
  2803.       tempo[j++]=(char) ehex(s+i);
  2804.       i++;    // sauter 2 caractΦres finalement
  2805.     }
  2806.     /*
  2807.     NON a cause de trucs comme /home/0,1837,1|7|1173|Content,00.html
  2808.     else if (s[i]=='|') {                     // exemple: file:///C|Program%20Files...
  2809.       tempo[j++]=':';
  2810.     }
  2811.     */
  2812.     else
  2813.       tempo[j++]=s[i];
  2814.   }
  2815.   tempo[j++]='\0';
  2816.   return tempo;
  2817. }
  2818.  
  2819. // unescape in URL/URI ONLY what has to be escaped, to form a standard URL/URI
  2820. char* unescape_http_unharm(char* s, int no_high) {
  2821.   char* tempo;
  2822.   int i,j=0;
  2823.   NOSTATIC_RESERVE(tempo, char, HTS_URLMAXSIZE*2);
  2824.   for (i=0;i<(int) strlen(s);i++) {
  2825.     if (s[i]=='%') {
  2826.       int nchar=(char) ehex(s+i+1);
  2827.  
  2828.       int test = (  CHAR_RESERVED(nchar)
  2829.                 || CHAR_DELIM(nchar)
  2830.                 || CHAR_UNWISE(nchar)
  2831.                 || CHAR_LOW(nchar)        /* CHAR_SPECIAL */
  2832.                 || CHAR_XXAVOID(nchar) 
  2833.                 || (
  2834.                   (no_high)
  2835.                   &&
  2836.                   CHAR_HIG(nchar)
  2837.                 )
  2838.                 );
  2839.  
  2840.       if (!test) {
  2841.         tempo[j++]=(char) ehex(s+i+1);
  2842.         i+=2;
  2843.       } else {
  2844.         tempo[j++]='%';
  2845.       }
  2846.     }
  2847.     /*
  2848.     NON a cause de trucs comme /home/0,1837,1|7|1173|Content,00.html
  2849.     else if (s[i]=='|') {                     // exemple: file:///C|Program%20Files...
  2850.       tempo[j++]=':';
  2851.     }
  2852.     */
  2853.     else
  2854.       tempo[j++]=s[i];
  2855.   }
  2856.   tempo[j++]='\0';
  2857.   return tempo;
  2858. }
  2859.  
  2860. // remplacer " par %xx etc..
  2861. // buffer MAX 1Ko
  2862. void escape_spc_url(char* s) {
  2863.   x_escape_http(s,2);
  2864. }
  2865. // smith / john -> smith%20%2f%20john
  2866. void escape_in_url(char* s) {
  2867.   x_escape_http(s,1);
  2868. }
  2869. // smith / john -> smith%20/%20john
  2870. void escape_uri(char* s) {
  2871.   x_escape_http(s,3);
  2872. }
  2873. void escape_uri_utf(char* s) {
  2874.   x_escape_http(s,30);
  2875. }
  2876. void escape_check_url(char* s) {
  2877.   x_escape_http(s,0);
  2878. }
  2879. // same as escape_check_url, but returns char*
  2880. char* escape_check_url_addr(char* s) {
  2881.   char* adr;
  2882.   escape_check_url(adr = concat(s,""));
  2883.   return adr;
  2884. }
  2885.  
  2886.  
  2887. void x_escape_http(char* s,int mode) {
  2888.   while(*s) {
  2889.     int test=0;
  2890.     if (mode == 0)
  2891.       test=(strchr("\" ",*s)!=0);
  2892.     else if (mode==1) {
  2893.       test = (  CHAR_RESERVED(*s)
  2894.              || CHAR_DELIM(*s)
  2895.              || CHAR_UNWISE(*s)
  2896.              || CHAR_SPECIAL(*s)
  2897.              || CHAR_XXAVOID(*s) );
  2898.     }
  2899.     else if (mode==2)
  2900.       test=(strchr(" ",*s)!=0);           // n'escaper que espace
  2901.     else if (mode==3) {                   // Θchapper que ce qui est nΘcessaire
  2902.       test = (
  2903.                 CHAR_SPECIAL(*s)
  2904.              || CHAR_XXAVOID(*s) );
  2905.     }
  2906.     else if (mode==30) {                   // Θchapper que ce qui est nΘcessaire
  2907.       test = (
  2908.                 CHAR_LOW(*s)
  2909.              || CHAR_XXAVOID(*s) );
  2910.     }
  2911.  
  2912.     if (test) {
  2913.       char buffer[HTS_URLMAXSIZE*2];
  2914.       int n;
  2915.       n=(int)(unsigned char) *s;
  2916.       strcpy(buffer,s+1);
  2917.       sprintf(s,"%%%02x",n);
  2918.       strcat(s,buffer);
  2919.     }
  2920.     s++;
  2921.   }
  2922. }
  2923.  
  2924.  
  2925. HTS_INLINE int ehexh(char c) {
  2926.   if ((c>='0') && (c<='9')) return c-'0';
  2927.   if ((c>='a') && (c<='f')) c-=('a'-'A');
  2928.   if ((c>='A') && (c<='F')) return (c-'A'+10);
  2929.   return 0;
  2930. }
  2931.  
  2932. HTS_INLINE int ehex(char* s) {
  2933.   return 16*ehexh(*s)+ehexh(*(s+1));
  2934.  
  2935. }
  2936.  
  2937. // concat, concatΦne deux chaines et renvoi le rΘsultat
  2938. // permet d'allΘger grandement le code
  2939. // il faut savoir qu'on ne peut mettre plus de 16 concat() dans une expression
  2940. typedef struct {
  2941.   char buff[16][HTS_URLMAXSIZE*2*2];
  2942.   int rol;
  2943. } concat_strc;
  2944. char* concat(const char* a,const char* b) {
  2945.   concat_strc* strc;
  2946.   NOSTATIC_RESERVE(strc, concat_strc, 1);
  2947.   strc->rol=((strc->rol+1)%16);    // roving pointer
  2948.   strcpy(strc->buff[strc->rol],a);
  2949.   if (b) strcat(strc->buff[strc->rol],b);
  2950.   return strc->buff[strc->rol];
  2951. }
  2952. // conversion fichier / -> antislash
  2953. #if HTS_DOSNAME
  2954. char* __fconv(char* a) {
  2955.   int i;
  2956.   for(i=0;i<(int) strlen(a);i++)
  2957.     if (a[i]=='/')  // convertir
  2958.       a[i]='\\';
  2959.   return a;
  2960. }
  2961. char* fconcat(char* a,char* b) {
  2962.   return __fconv(concat(a,b));
  2963. }
  2964. char* fconv(char* a) {
  2965.   return __fconv(concat(a,""));
  2966. }
  2967. #endif
  2968.  
  2969. /* / et \\ en / */
  2970. char* __fslash(char* a) {
  2971.   int i;
  2972.   for(i=0;i<(int) strlen(a);i++)
  2973.     if (a[i]=='\\')  // convertir
  2974.       a[i]='/';
  2975.   return a;
  2976. }
  2977. char* fslash(char* a) {
  2978.   return __fslash(concat(a,""));
  2979. }
  2980.  
  2981. // conversion minuscules, avec buffer
  2982. char* convtolower(char* a) {
  2983.   concat_strc* strc;
  2984.   NOSTATIC_RESERVE(strc, concat_strc, 1);
  2985.   strc->rol=((strc->rol+1)%16);    // roving pointer
  2986.   strcpy(strc->buff[strc->rol],a);
  2987.   hts_lowcase(strc->buff[strc->rol]);  // lower case
  2988.   return strc->buff[strc->rol];
  2989. }
  2990.  
  2991. // conversion en minuscules
  2992. void hts_lowcase(char* s) {
  2993.   int i;
  2994.   for(i=0;i<(int) strlen(s);i++)
  2995.     if ((s[i]>='A') && (s[i]<='Z'))
  2996.       s[i]+=('a'-'A');
  2997. }
  2998.  
  2999. // remplacer un caractΦre d'une chaεne dans une autre
  3000. HTS_INLINE void hts_replace(char *s,char from,char to) { 
  3001.   char* a;
  3002.   while ((a=strchr(s,from))!=NULL) {
  3003.     *a=to;
  3004.   }
  3005. }
  3006.  
  3007.  
  3008. // caractΦre espace, guillemets, CR, LF etc..
  3009. /* SECTION OPTIMISEE:
  3010.   #define  is_space(c) (strchr(" \"\x0d\x0a\x09'",c)!=NULL)
  3011.   #define  is_realspace(c) (strchr(" \x0d\x0a\x09",c)!=NULL)
  3012. */
  3013. /*
  3014. HTS_INLINE int is_space(char c) {
  3015.   if (c==' ')  return 1;  // spc
  3016.   if (c=='"')  return 1;  // quote
  3017.   if (c==10)   return 1;  // lf
  3018.   if (c==13)   return 1;  // cr
  3019.   if (c=='\'') return 1;  // quote
  3020.   //if (c=='`')  return 1;  // backquote      << non
  3021.   if (c==9)    return 1;  // tab
  3022.   return 0;
  3023. }
  3024. */
  3025.  
  3026. // caractΦre espace, CR, LF, TAB
  3027. /*
  3028. HTS_INLINE int is_realspace(char c) {
  3029.   if (c==' ')  return 1;  // spc
  3030.   if (c==10)   return 1;  // lf
  3031.   if (c==13)   return 1;  // cr
  3032.   if (c==9)    return 1;  // tab
  3033.   return 0;
  3034. }
  3035. */
  3036.  
  3037.  
  3038.  
  3039.  
  3040.  
  3041. // deviner type d'un fichier local..
  3042. // ex: fil="toto.gif" -> s="image/gif"
  3043. void guess_httptype(char *s,char *fil) {
  3044.   get_httptype(s,fil,1);
  3045. }
  3046. // idem
  3047. // flag: 1 si toujours renvoyer un type
  3048. void get_httptype(char *s,char *fil,int flag) {
  3049.   if (ishtml(fil)==1)
  3050.     strcpy(s,"text/html");
  3051.   else {
  3052.     char *a=fil+strlen(fil)-1;    
  3053.     while ( (*a!='.') && (*a!='/')  && (a>fil)) a--;
  3054.     if (*a=='.') {
  3055.       int ok=0;
  3056.       int j=0;
  3057.       a++;
  3058.       while( (!ok) && (strnotempty(hts_mime[j][1])) ) {
  3059.         if (strfield2(hts_mime[j][1],a)) {
  3060.           if (hts_mime[j][0][0]!='*') {    // Une correspondance existe
  3061.             strcpy(s,hts_mime[j][0]);
  3062.             ok=1;
  3063.           }
  3064.         }
  3065.         j++;
  3066.       }
  3067.       
  3068.       if (!ok) if (flag) sprintf(s,"application/%s",a);
  3069.     } else {
  3070.       if (flag) strcpy(s,"application/octet-stream");
  3071.     }
  3072.   }
  3073. }
  3074.  
  3075. // get type of fil (php)
  3076. // s: buffer (text/html) or NULL
  3077. // return: 1 if known by user
  3078. int get_userhttptype(int setdefs,char *s,char *ext) {
  3079.   char** buffer=NULL;
  3080.   NOSTATIC_RESERVE(buffer, char*, 1);
  3081.   if (setdefs) {
  3082.     *buffer=s;
  3083.     return 1;
  3084.   } else {
  3085.     if (s)
  3086.       s[0]='\0';
  3087.     if (!ext)
  3088.       return 0;
  3089.     if (*buffer) {
  3090.       char search[1024];
  3091.       char* detect;
  3092.       sprintf(search,"\n%s=",ext);    // php=text/html
  3093.       detect=strstr(*buffer,search);
  3094.       if (!detect) {
  3095.         sprintf(search,"\n%s\n",ext); // php\ncgi=text/html
  3096.         detect=strstr(*buffer,search);
  3097.       }
  3098.       if (detect) {
  3099.         detect=strchr(detect,'=');
  3100.         if (detect) {
  3101.           detect++;
  3102.           if (s) {
  3103.             char* a;
  3104.             a=strchr(detect,'\n');
  3105.             if (a) {
  3106.               strncat(s,detect,(int) (a - detect));
  3107.             }
  3108.           }
  3109.           return 1;
  3110.         }
  3111.       }
  3112.     }
  3113.   }
  3114.   return 0;
  3115. }
  3116. // renvoyer extesion d'un type mime..
  3117. // ex: "image/gif" -> gif
  3118. void give_mimext(char *s,char *st) {   
  3119.   int ok=0;
  3120.   int j=0;
  3121.   s[0]='\0';
  3122.   while( (!ok) && (strnotempty(hts_mime[j][1])) ) {
  3123.     if (strfield2(hts_mime[j][0],st)) {
  3124.       if (hts_mime[j][1][0]!='*') {    // Une correspondance existe
  3125.         strcpy(s,hts_mime[j][1]);
  3126.         ok=1;
  3127.       }
  3128.     }
  3129.     j++;
  3130.   }
  3131.   // wrap "x" mimetypes, such as:
  3132.   // application/x-mp3
  3133.   // or
  3134.   // application/mp3
  3135.   if (!ok) {
  3136.     int p;
  3137.     char* a=NULL;
  3138.     if ((p=strfield(st,"application/x-")))
  3139.       a=st+p;
  3140.     else if ((p=strfield(st,"application/")))
  3141.       a=st+p;
  3142.     if (a) {
  3143.       if ((int)strlen(a) >= 1) {
  3144.         if ((int)strlen(a) <= 4) {
  3145.           strcpy(s,a);
  3146.           ok=1;
  3147.         }
  3148.       }
  3149.     }
  3150.   }
  3151. }
  3152. // extension connue?..
  3153. //  0 : non
  3154. //  1 : oui
  3155. //  2 : html
  3156. int is_knowntype(char *fil) {
  3157.   int j=0;
  3158.   if (!fil)
  3159.     return 0;
  3160.   while(strnotempty(hts_mime[j][1])) {
  3161.     if (strfield2(hts_mime[j][1],fil)) {
  3162.       if (strfield2(hts_mime[j][0],"text/html"))
  3163.         return 2;
  3164.       else
  3165.         return 1;
  3166.     }
  3167.     j++;
  3168.   }
  3169.  
  3170.   // Known by user?
  3171.   return (is_userknowntype(fil));
  3172. }
  3173. // extension : html,gif..
  3174. char* get_ext(char *fil) {
  3175.   char* fil_noquery;
  3176.   char *a=fil+strlen(fil)-1;    
  3177.   NOSTATIC_RESERVE(fil_noquery, char, HTS_URLMAXSIZE*2);
  3178.  
  3179.   while ( (*a!='.') && (*a!='/')  && (a>fil)) a--;
  3180.   if (*a=='.') {
  3181.     fil_noquery[0]='\0';
  3182.     a++;  // pointer sur extension
  3183.     strncat(fil_noquery,a,HTS_URLMAXSIZE);
  3184.     a=strchr(fil_noquery,'?');
  3185.     if (a)
  3186.       *a='\0';
  3187.     return concat(fil_noquery,"");
  3188.   }
  3189.   else
  3190.     return "";
  3191. }
  3192. // known type?..
  3193. //  0 : no
  3194. //  1 : yes
  3195. //  2 : html
  3196. // setdefs : set mime buffer:
  3197. //   file=(char*) "asp=text/html\nphp=text/html\n"
  3198. int is_userknowntype(char *fil) {
  3199.   char mime[1024];
  3200.   if (!fil)
  3201.     return 0;
  3202.   if (!strnotempty(fil))
  3203.     return 0;
  3204.   mime[0]='\0';
  3205.   get_userhttptype(0,mime,fil);
  3206.   if (!strnotempty(mime))
  3207.     return 0;
  3208.   else if (strfield2(mime,"text/html"))
  3209.     return 2;
  3210.   else
  3211.     return 1;
  3212. }
  3213.  
  3214. // page dynamique?
  3215. // is_dyntype(get_ext("foo.asp"))
  3216. int is_dyntype(char *fil) {
  3217.   int j=0;
  3218.   if (!fil)
  3219.     return 0;
  3220.   if (!strnotempty(fil))
  3221.     return 0;
  3222.   while(strnotempty(hts_ext_dynamic[j])) {
  3223.     if (strfield2(hts_ext_dynamic[j],fil)) {
  3224.       return 1;
  3225.     }
  3226.     j++;
  3227.   }
  3228.   return 0;
  3229. }
  3230.  
  3231. // types critiques qui ne doivent pas Ωtre changΘs car renvoyΘs par des serveurs qui ne
  3232. // connaissent pas le type
  3233. int may_unknown(char* st) {
  3234.   int j=0;
  3235.   // types mΘdia
  3236.   if (may_be_hypertext_mime(st))
  3237.     return 1;
  3238.   while(strnotempty(hts_mime_keep[j])) {
  3239.     if (strfield2(hts_mime_keep[j],st)) {      // trouvΘ
  3240.       return 1;
  3241.     }
  3242.     j++;
  3243.   }    
  3244.   return 0;
  3245. }
  3246.  
  3247.  
  3248.  
  3249. // -- Utils fichiers
  3250.  
  3251. // pretty print for i/o
  3252. void fprintfio(FILE* fp,char* buff,char* prefix) {
  3253.   char nl=1;
  3254.   while(*buff) {
  3255.     switch(*buff) {
  3256.     case 13: break;
  3257.     case 10:
  3258.       fprintf(fp,"\r\n");
  3259.       nl=1;
  3260.     break;
  3261.     default:
  3262.       if (nl)
  3263.         fprintf(fp,prefix);
  3264.       nl=0;
  3265.       fputc(*buff,fp);
  3266.     }
  3267.     buff++;
  3268.   }
  3269. }
  3270.  
  3271. /* Le fichier existe-t-il? (ou est-il accessible?) */
  3272. int fexist(char* s) {
  3273.   FILE* fp;
  3274.   if (strnotempty(s)==0)     // nom vide: non trouvΘ
  3275.     return 0;
  3276.   fp=fopen(fconv(s),"rb");
  3277.   if (fp!=NULL) fclose(fp);
  3278.   return (fp!=NULL);
  3279.  
  3280. /* Taille d'un fichier, -1 si n'existe pas */
  3281. /* fp->_cnt ne fonctionne pas sur toute les plate-formes :-(( */
  3282. /* Note: NOT YET READY FOR 64-bit */
  3283. //LLint fsize(char* s) {
  3284. int fsize(char* s) {
  3285.   /*
  3286. #if HTS_WIN
  3287.   HANDLE hFile;
  3288.   DWORD dwSizeHigh = 0;
  3289.   DWORD dwSizeLow  = 0;
  3290.   hFile = CreateFile(s,0,0,NULL,OPEN_EXISTING,0,NULL);
  3291.   if (hFile) {
  3292.     dwSizeLow = GetFileSize (hFile, & dwSizeHigh) ;
  3293.     CloseHandle(hFile);
  3294.     if (dwSizeLow != 0xFFFFFFFF)
  3295.       return (dwSizeLow & (dwSizeHigh<<32));
  3296.     else
  3297.       return -1;
  3298.   } else
  3299.     return -1;
  3300. #else
  3301.     */
  3302.   FILE* fp;
  3303.   if (strnotempty(s)==0)     // nom vide: erreur
  3304.     return -1;
  3305.   fp=fopen(fconv(s),"rb");
  3306.   if (fp!=NULL) {
  3307.     int i;
  3308.     fseek(fp,0,SEEK_END);
  3309.     i=ftell(fp);
  3310.     fclose(fp);
  3311.     return i;
  3312.   } else return -1;
  3313.   /*
  3314. #endif
  3315.   */
  3316. }
  3317.  
  3318. int fpsize(FILE* fp) {
  3319.   int oldpos,size;
  3320.   if (!fp)
  3321.     return -1;
  3322.   oldpos=ftell(fp);
  3323.   fseek(fp,0,SEEK_END);
  3324.   size=ftell(fp);
  3325.   fseek(fp,oldpos,SEEK_SET);
  3326.   return size;
  3327. }
  3328.  
  3329. /* root dir, with ending / */
  3330. typedef struct {
  3331.   char path[1024+4];
  3332.   int init;
  3333. } hts_rootdir_strc;
  3334. char* hts_rootdir(char* file) {
  3335.   hts_rootdir_strc* strc;
  3336.   NOSTATIC_RESERVE(strc, hts_rootdir_strc, 1);
  3337.   if (file) {
  3338.     if (!strc->init) {
  3339.       strc->path[0]='\0';
  3340.       strc->init=1;
  3341.       if (strnotempty(file)) {
  3342.         char* a;
  3343.         strcpy(strc->path,file);
  3344.         while((a=strrchr(strc->path,'\\'))) *a='/';
  3345.         if ((a=strrchr(strc->path,'/'))) {
  3346.           *(a+1)='\0';
  3347.         } else
  3348.           strc->path[0]='\0';
  3349.       }
  3350.       if (!strnotempty(strc->path)) {
  3351.         if( getcwd( strc->path, 1024 ) == NULL )
  3352.             strc->path[0]='\0';
  3353.         else
  3354.           strcat(strc->path,"/");
  3355.       }
  3356.     }
  3357.     return NULL;
  3358.   } else if (strc->init)
  3359.     return strc->path;
  3360.   else
  3361.     return "";
  3362. }
  3363.  
  3364.  
  3365.  
  3366. hts_stat_struct HTS_STAT;
  3367. //
  3368. // return  number of downloadable bytes, depending on rate limiter
  3369. // see engine_stats() routine, too
  3370. // this routine works quite well for big files and regular ones, but apparently the rate limiter has
  3371. // some problems with very small files (rate too high)
  3372. LLint check_downloadable_bytes(int rate) {
  3373.   if (rate>0) {
  3374.     TStamp time_now;
  3375.     TStamp elapsed_useconds;
  3376.     LLint bytes_transfered_during_period;
  3377.     LLint left;
  3378.  
  3379.     // get the older timer
  3380.     int id_timer = (HTS_STAT.istat_idlasttimer + 1) % 2;
  3381.  
  3382.     time_now=mtime_local();
  3383.     elapsed_useconds = time_now - HTS_STAT.istat_timestart[id_timer];
  3384.     // NO totally stupid - elapsed_useconds+=1000;      // for the next second, too
  3385.     bytes_transfered_during_period = (HTS_STAT.HTS_TOTAL_RECV-HTS_STAT.istat_bytes[id_timer]);
  3386.     
  3387.     left = ((rate * elapsed_useconds)/1000) - bytes_transfered_during_period;
  3388.     if (left <= 0)
  3389.       left = 0;
  3390.     
  3391.     return left;
  3392.   } else
  3393.     return TAILLE_BUFFER;
  3394. }
  3395.  
  3396. //
  3397. // 0 : OK
  3398. // 1 : slow down
  3399. #if 0
  3400. int HTS_TOTAL_RECV_CHECK(int var) {
  3401.   if (HTS_STAT.HTS_TOTAL_RECV_STATE)
  3402.     return 1;
  3403.     /*
  3404.     {
  3405.     if (HTS_STAT.HTS_TOTAL_RECV_STATE==3) { 
  3406.       var = min(var,32); 
  3407.       Sleep(250); 
  3408.     } else if (HTS_STAT.HTS_TOTAL_RECV_STATE==2) { 
  3409.       var = min(var,256); 
  3410.       Sleep(100); 
  3411.     } else { 
  3412.       var/=2; 
  3413.       if (var<=0) var=1; 
  3414.       Sleep(50); 
  3415.     } 
  3416.   }
  3417.     */
  3418.   return 0;
  3419. }
  3420. #endif
  3421.  
  3422. // Lecture dans buff de size octets au maximum en utilisant la socket r (structure htsblk)
  3423. // >0 : data received
  3424. // == 0 : not yet data
  3425. // <0 : no more data or error
  3426. HTS_INLINE int hts_read(htsblk* r,char* buff,int size) {
  3427.   int retour;
  3428.   //  return read(soc,buff,size);
  3429.   if (r->is_file) {
  3430. #if HTS_WIDE_DEBUG    
  3431.     DEBUG_W("read\n");
  3432. #endif
  3433.     if (r->fp)
  3434.       retour=fread(buff,1,size,r->fp);
  3435.     else
  3436.       retour=-1;
  3437.   } else {
  3438. #if HTS_WIDE_DEBUG    
  3439.     DEBUG_W("recv\n");
  3440.     if (r->soc==INVALID_SOCKET)
  3441.       printf("!!WIDE_DEBUG ERROR, soc==INVALID hts_read\n");
  3442. #endif
  3443.     //HTS_TOTAL_RECV_CHECK(size);         // Diminuer au besoin si trop de donnΘes reτues
  3444. #if HTS_USEOPENSSL
  3445.     if (r->ssl) {
  3446.       retour = SSL_read(r->ssl_con, buff, size);
  3447.       if (retour <= 0) {
  3448.         int err_code = SSL_get_error(r->ssl_con, retour);
  3449.         if (
  3450.           (err_code == SSL_ERROR_WANT_READ)
  3451.           ||
  3452.           (err_code == SSL_ERROR_WANT_WRITE)
  3453.           ) 
  3454.         {
  3455.           retour = 0;             /* no data yet (ssl cache) */
  3456.         } else {
  3457.           retour = -1;            /* eof or error */
  3458.         }
  3459.       }
  3460.     } else {
  3461. #endif
  3462.     retour=recv(r->soc,buff,size,0);
  3463.   }
  3464.   if (retour > 0)    // compter flux entrant
  3465.     HTS_STAT.HTS_TOTAL_RECV+=retour;
  3466. #if HTS_USEOPENSSL
  3467.   }
  3468. #endif
  3469. #if HTS_WIDE_DEBUG    
  3470.   DEBUG_W("recv/read done\n");
  3471. #endif
  3472.   return retour;
  3473. }
  3474.  
  3475.  
  3476. // -- Gestion cache DNS --
  3477. // 'RX98
  3478. #if HTS_DNSCACHE
  3479.  
  3480. // 'capsule' contenant uniquement le cache
  3481. t_dnscache* _hts_cache(void) {
  3482.   t_dnscache* cache;
  3483.   NOSTATIC_RESERVE(cache, t_dnscache, 1);
  3484.   return cache;
  3485. }
  3486.  
  3487. // lock le cache dns pour tout opΘration d'ajout
  3488. // plus prudent quand plusieurs threads peuvent Θcrire dedans..
  3489. // -1: status? 0: libΘrer 1:locker
  3490.  
  3491. /* 
  3492.   Simple lock function for cache
  3493.  
  3494.   Return value: always 0
  3495.   Parameter:
  3496.   1 wait for lock (mutex) available and lock it
  3497.   0 unlock the mutex
  3498.   [-1 check if locked (always return 0 with mutex)]
  3499.   -999 initialize
  3500. */
  3501. #if USE_BEGINTHREAD
  3502. int _hts_lockdns(int i) {
  3503.   static PTHREAD_LOCK_TYPE hMutex; 
  3504.   return htsSetLock(&hMutex,i);
  3505. }
  3506. #else
  3507. int _hts_lockdns(int i) {
  3508.   int l=0;
  3509.   if (i>=0)
  3510.     l=i;
  3511.   return l;
  3512. }
  3513. #endif
  3514.  
  3515. // routine pour le cache - retour optionnel α donner α chaque fois
  3516. // NULL: nom non encore testΘ dans le cache
  3517. // si h_length==0 alors le nom n'existe pas dans le dns
  3518. t_hostent* _hts_ghbn(t_dnscache* cache,char* iadr,t_hostent* retour) {
  3519.   // attendre que le cache dns soit prΩt
  3520.   while(_hts_lockdns(-1));  // attendre libΘration
  3521.   _hts_lockdns(1);          // locker
  3522.  
  3523.   while(1) {
  3524.     if (strcmp(cache->iadr,iadr)==0) {  // ok trouvΘ
  3525.       if (cache->host_length>0) {  // entrΘe valide
  3526.         if (retour->h_addr_list[0])
  3527.           memcpy(retour->h_addr_list[0], cache->host_addr, cache->host_length);
  3528.         retour->h_length=cache->host_length;
  3529.       } else if (cache->host_length==0) {  // en cours
  3530.         _hts_lockdns(0);          // dΘlocker
  3531.         return NULL;
  3532.       } else {                    // erreur dans le dns, dΘja vΘrifiΘ
  3533.         if (retour->h_addr_list[0])
  3534.           retour->h_addr_list[0][0]='\0';
  3535.         retour->h_length=0;  // erreur, n'existe pas
  3536.       }
  3537.       _hts_lockdns(0);          // dΘlocker
  3538.       return retour;
  3539.     } else {    // on a pas encore trouvΘ
  3540.       if (cache->n!=NULL) { // chercher encore
  3541.         cache=cache->n;   // suivant!
  3542.       } else {
  3543.         _hts_lockdns(0);          // dΘlocker
  3544.         return NULL;    // non prΘsent        
  3545.       }
  3546.     }    
  3547.   }
  3548. }
  3549.  
  3550. // tester si iadr a dΘja ΘtΘ testΘ (ou en cours de test)
  3551. // 0 non encore
  3552. // 1 ok
  3553. // 2 non prΘsent
  3554. int hts_dnstest(char* _iadr) {
  3555.   char* iadr;
  3556.   t_dnscache* cache=_hts_cache();  // adresse du cache 
  3557.   NOSTATIC_RESERVE(iadr, char, HTS_URLMAXSIZE*2);
  3558.  
  3559.   // sauter user:pass@ Θventuel
  3560.   strcpy(iadr,jump_identification(_iadr));
  3561.   // couper Θventuel :
  3562.   {
  3563.     char *a;
  3564.     if ( (a=jump_toport(iadr)) )
  3565.       *a='\0';
  3566.   }
  3567.  
  3568. #if HTS_WIN
  3569.   if (inet_addr(iadr)!=INADDR_NONE)  // numΘrique
  3570. #else
  3571.   if (inet_addr(iadr)!=(in_addr_t) -1 )  // numΘrique
  3572. #endif
  3573.     return 1;
  3574.  
  3575.   while(_hts_lockdns(-1));  // attendre libΘration
  3576.   _hts_lockdns(1);          // locker
  3577.   while(1) {
  3578.     if (strcmp(cache->iadr,iadr)==0) {  // ok trouvΘ
  3579.       _hts_lockdns(0);          // dΘlocker
  3580.       return 1;    // prΘsent!
  3581.     } else {    // on a pas encore trouvΘ
  3582.       if (cache->n!=NULL) { // chercher encore
  3583.         cache=cache->n;   // suivant!
  3584.       } else {
  3585.         _hts_lockdns(0);          // dΘlocker
  3586.         return 2;    // non prΘsent        
  3587.       }
  3588.     }    
  3589.   }
  3590. }
  3591.  
  3592.  
  3593. t_hostent* vxgethostbyname(char* hostname, void* v_buffer) {
  3594.   t_fullhostent* buffer = (t_fullhostent*) v_buffer;
  3595.   /* Clear */
  3596.   fullhostent_init(buffer);
  3597.  
  3598.   /* Protection */
  3599.   if (!strnotempty(hostname)) {
  3600.     return NULL;
  3601.   }
  3602.  
  3603.   /* 
  3604.     Strip [] if any : [3ffe:b80:1234:1::1] 
  3605.     The resolver doesn't seem to handle IP6 addresses in brackets
  3606.   */
  3607.   if ((hostname[0] == '[') && (hostname[strlen(hostname)-1] == ']')) {
  3608.     char tempo[HTS_URLMAXSIZE*2];
  3609.     tempo[0]='\0';
  3610.     strncat(tempo, hostname+1, strlen(hostname)-2);
  3611.     strcpy(hostname, tempo);
  3612.   }
  3613.  
  3614.   {
  3615. #if HTS_INET6==0
  3616.   /*
  3617.   ipV4 resolver
  3618.     */
  3619.     t_hostent* hp=gethostbyname(hostname);
  3620.     if (hp!=NULL) {
  3621.       if ( (hp->h_length) && ( ((unsigned int) hp->h_length) <= buffer->addr_maxlen) ) {
  3622.         memcpy(buffer->hp.h_addr_list[0], hp->h_addr_list[0], hp->h_length);
  3623.         buffer->hp.h_length = hp->h_length;
  3624.         return &(buffer->hp);
  3625.       }
  3626.     }
  3627. #else
  3628.     /*
  3629.     ipV6 resolver
  3630.     */
  3631.     /*
  3632.     int error_num=0;
  3633.     t_hostent* hp=getipnodebyname(hostname, AF_INET6, AI_DEFAULT, &error_num);
  3634.     oops, deprecated :(
  3635.     */
  3636.     struct addrinfo* res = NULL;
  3637.     struct addrinfo hints;
  3638.     memset(&hints, 0, sizeof(hints));
  3639.     hints.ai_family = PF_UNSPEC;
  3640.     hints.ai_socktype = SOCK_STREAM;
  3641.     hints.ai_protocol = IPPROTO_TCP;
  3642.     if (getaddrinfo(hostname, NULL, &hints, &res) == 0) {
  3643.       if (res) {
  3644.         if ( (res->ai_addr) && (res->ai_addrlen) && (res->ai_addrlen <= buffer->addr_maxlen) ) {
  3645.           memcpy(buffer->hp.h_addr_list[0], res->ai_addr, res->ai_addrlen);
  3646.           buffer->hp.h_length = res->ai_addrlen;
  3647.           return &(buffer->hp);
  3648.         }
  3649.       }
  3650.     }
  3651.     if (res) {
  3652.       freeaddrinfo(res);
  3653.     }
  3654.     
  3655. #endif
  3656.   }
  3657.   return NULL;
  3658. }
  3659.  
  3660. // cache dns interne α HTS // ** FREE A FAIRE sur la chaine
  3661. t_hostent* hts_gethostbyname(char* _iadr, void* v_buffer) {
  3662.   char iadr[HTS_URLMAXSIZE*2];
  3663.   t_fullhostent* buffer = (t_fullhostent*) v_buffer;
  3664.   t_dnscache* cache=_hts_cache();  // adresse du cache
  3665.   t_hostent* hp;
  3666.  
  3667.   /* Clear */
  3668.   fullhostent_init(buffer);
  3669.  
  3670.   strcpy(iadr,jump_identification(_iadr));
  3671.   // couper Θventuel :
  3672.   {
  3673.     char *a;
  3674.     if ( (a=jump_toport(iadr)) )
  3675.       *a='\0';
  3676.   }
  3677.  
  3678.   // effacer structure de retour, crΘer nouvelle
  3679.   /*
  3680.   memset(&host, 0, sizeof(t_hostent));  
  3681.   host.h_addr_list=he;
  3682.   he[0]=NULL;
  3683.   he[1]=NULL;  
  3684.   host.h_length=0;  
  3685.   */
  3686.   cache->iadr[0]='*';
  3687.   cache->iadr[1]='\0';
  3688.   
  3689.   /* get IP from the dns cache */
  3690.   hp = _hts_ghbn(cache, iadr, &buffer->hp);
  3691.   if (hp) {
  3692.     if (hp->h_length>0)
  3693.       return hp;
  3694.     else
  3695.       return NULL;    // entrΘe erronΘe (erreur DNS) dans le DNS
  3696.   } else {  // non prΘsent dans le cache dns, tester
  3697.     t_dnscache* c=cache;
  3698.     while(c->n) c=c->n;    // calculer queue
  3699.     
  3700. #if HTS_WIDE_DEBUG    
  3701.     DEBUG_W("gethostbyname\n");
  3702. #endif      
  3703. #if HDEBUG
  3704.     printf("gethostbyname (not in cache)\n");
  3705. #endif
  3706.     {
  3707.       unsigned long inetaddr;
  3708. #if HTS_WIN
  3709.       if ((inetaddr=inet_addr(iadr))==INADDR_NONE) {
  3710. #else
  3711.       if ((inetaddr=inet_addr(iadr))==(in_addr_t) -1 ) {
  3712. #endif        
  3713. #if DEBUGDNS 
  3714.         printf("resolving (not cached) %s\n",iadr);
  3715. #endif
  3716.         hp=vxgethostbyname(iadr, buffer);  // calculer IP host
  3717.       } else {     // numΘrique, convertir sans passer par le dns
  3718.         buffer->hp.h_addr_list[0]=(char*) &inetaddr;
  3719.         buffer->hp.h_length=4;
  3720.         hp=&buffer->hp;
  3721.       }
  3722.     }
  3723. #if HTS_WIDE_DEBUG    
  3724.     DEBUG_W("gethostbyname done\n");
  3725. #endif
  3726.     cache->n=(t_dnscache*) calloct(1,sizeof(t_dnscache));
  3727.     if (cache->n!=NULL) {
  3728.       strcpy(cache->n->iadr,iadr);
  3729.       if (hp!=NULL) {
  3730.         memcpy(cache->n->host_addr, hp->h_addr_list[0], hp->h_length);
  3731.         cache->n->host_length=hp->h_length;
  3732.       } else {
  3733.         cache->n->host_addr[0]='\0';
  3734.         cache->n->host_length=0;  // non existant dans le dns
  3735.       }
  3736.       cache->n->n=NULL;
  3737.       return hp;
  3738.     } else {  // on peut pas noter, mais on peut renvoyer le rΘsultat
  3739.       return hp;
  3740.     }        
  3741.   }  // retour hp du cache
  3742. }
  3743.  
  3744. #else
  3745. HTS_INLINE t_hostent* hts_gethostbyname(char* iadr, t_fullhostent* buffer) {
  3746.   t_hostent* retour;
  3747. #if HTS_WIDE_DEBUG    
  3748.   DEBUG_W("gethostbyname (2)\n");
  3749. #endif
  3750. #if DEBUGDNS 
  3751.     printf("blocking method gethostbyname() in progress for %s\n",iadr);
  3752. #endif
  3753.   retour=vxgethostbyname(jump_identification(iadr), );
  3754. #if HTS_WIDE_DEBUG    
  3755.   DEBUG_W("gethostbyname (2) done\n");
  3756. #endif
  3757.   return retour;
  3758. }
  3759. #endif
  3760.  
  3761.  
  3762. // --- Tracage des mallocs() ---
  3763. #if HTS_TRACE_MALLOC
  3764. typedef struct _mlink {
  3765.   void* adr;
  3766.   int len;
  3767.   int id;
  3768.   struct _mlink* next;
  3769. } mlink;
  3770. mlink trmalloc = {NULL,0,0,NULL};
  3771. int trmalloc_id=0;
  3772.  
  3773. HTS_INLINE void* hts_malloc(size_t len,size_t len2) {
  3774.   mlink* lnk = (mlink*) calloc(1,sizeof(mlink));
  3775.   void*  r   = NULL;
  3776.   if (lnk) {
  3777.     if (len2)
  3778.       r = calloc(len,len2);
  3779.     else
  3780.       r = malloc(len);
  3781.     if (r) {
  3782.       lnk->adr=r;
  3783.       if (len2)
  3784.         lnk->len=len*len2;
  3785.       else
  3786.         lnk->len=len;
  3787.       lnk->id=trmalloc_id++;
  3788.       lnk->next=trmalloc.next;
  3789.       trmalloc.next=lnk;
  3790. #if MEMDEBUG
  3791.       //printf("malloc: %d\n",r);
  3792. #endif
  3793.     } else free(lnk);
  3794.   }
  3795.   return r;
  3796. }
  3797. HTS_INLINE void  hts_free(void* adr) {
  3798.   mlink* lnk = &trmalloc;
  3799.   if (!adr) {
  3800. #if MEMDEBUG
  3801.     printf("* unexpected free() error at %d\n",adr);
  3802. #endif
  3803.     return;
  3804.   }
  3805.   do {
  3806.     if (lnk->next->adr==adr) {
  3807.       mlink* blk_free=lnk->next;
  3808. #if 1
  3809.       lnk->next=lnk->next->next;
  3810.       free((void*) blk_free);
  3811. #else
  3812. #if MEMDEBUG
  3813.       if (blk_free->id==-1) {
  3814.         printf("* memory has already been freed: %d (id=%d)\n",blk_free->adr,blk_free->id);
  3815.       }
  3816. #endif
  3817.       blk_free->id=-1;
  3818. #endif
  3819.       free(adr);
  3820. #if MEMDEBUG
  3821.       //printf("free: %d (id=%d)\n",blk_free->adr,blk_free->id);
  3822. #endif
  3823.       return;
  3824.     }
  3825.     lnk=lnk->next;
  3826.   } while(lnk->next != NULL);
  3827. #if MEMDEBUG
  3828.   printf("* unexpected free() error at %d\n",adr);
  3829. #endif
  3830.   free(adr);
  3831. }
  3832. HTS_INLINE void* hts_realloc(void* adr,size_t len) {
  3833.   mlink* lnk = &trmalloc;
  3834.   do {
  3835.     if (lnk->next->adr==adr) {
  3836.       adr = realloc(adr,len);
  3837.       lnk->next->adr = adr;
  3838.       lnk->next->len = len;
  3839. #if MEMDEBUG
  3840.       //printf("realloc: %d (id=%d)\n",lnk->next->adr,lnk->next->id);
  3841. #endif
  3842.       return adr;
  3843.     }
  3844.     lnk=lnk->next;
  3845.   } while(lnk->next != NULL);
  3846. #if MEMDEBUG
  3847.   printf("* unexpected realloc() error at %d\n",adr);
  3848. #endif
  3849.   return realloc(adr,len);
  3850. }
  3851. // check the malloct() and calloct() trace stack
  3852. void  hts_freeall(void) {
  3853.   while(trmalloc.next) {
  3854. #if MEMDEBUG
  3855.     printf("* block %d\t not released: at %d\t (%d\t bytes)\n",trmalloc.next->id,trmalloc.next->adr,trmalloc.next->len);
  3856. #endif
  3857.     if (trmalloc.next->id != -1) {
  3858.       freet(trmalloc.next->adr);
  3859.     }
  3860.   }
  3861. }
  3862. #endif
  3863.  
  3864.  
  3865. // -- divers //
  3866.  
  3867. // cut path and project name
  3868. // patch also initial path
  3869. void cut_path(char* fullpath,char* path,char* pname) {
  3870.   path[0]=pname[0]='\0';
  3871.   if (strnotempty(fullpath)) {
  3872.     if ((fullpath[strlen(fullpath)-1]=='/') || (fullpath[strlen(fullpath)-1]=='\\'))
  3873.       fullpath[strlen(fullpath)-1]='\0';
  3874.     if (strlen(fullpath)>1) {
  3875.       char* a;
  3876.       while( (a=strchr(fullpath,'\\')) ) *a='/';     // remplacer par /
  3877.       a=fullpath+strlen(fullpath)-2;
  3878.       while( (*a!='/') && ( a > fullpath)) a--;
  3879.       if (*a=='/') a++;
  3880.       strcpy(pname,a);
  3881.       strncat(path,fullpath,(int) (a - fullpath));
  3882.     }
  3883.   }
  3884. }
  3885.  
  3886.  
  3887.  
  3888. // -- Gestion protocole ftp --
  3889.  
  3890. #if HTS_WIN
  3891. int ftp_available(void) {
  3892.   return 1;
  3893. }
  3894. #else
  3895. int ftp_available(void) {
  3896.   return 1;   // ok!
  3897.   //return 0;   // SOUS UNIX, PROBLEMES
  3898. }
  3899. #endif
  3900.  
  3901.  
  3902.  
  3903. int hts_init(void) {
  3904.   static int hts_init_ok = 0;
  3905.   if (!hts_init_ok) {
  3906.     hts_init_ok = 1;
  3907.     // default wrappers
  3908.     htswrap_init();
  3909.     htswrap_add("init",htsdefault_init);
  3910.     htswrap_add("free",htsdefault_uninit);
  3911.     htswrap_add("start",htsdefault_start);
  3912.     htswrap_add("change-options",htsdefault_chopt);
  3913.     htswrap_add("end",htsdefault_end);
  3914.     htswrap_add("check-html",htsdefault_checkhtml);
  3915.     htswrap_add("loop",htsdefault_loop);
  3916.     htswrap_add("query",htsdefault_query);
  3917.     htswrap_add("query2",htsdefault_query2);
  3918.     htswrap_add("query3",htsdefault_query3);
  3919.     htswrap_add("check-link",htsdefault_check);
  3920.     htswrap_add("pause",htsdefault_pause);
  3921.     htswrap_add("save-file",htsdefault_filesave);
  3922.     htswrap_add("link-detected",htsdefault_linkdetected);
  3923.     htswrap_add("transfer-status",htsdefault_xfrstatus);
  3924.     htswrap_add("save-name",htsdefault_savename);
  3925.   }
  3926.   
  3927. #if HTS_USEOPENSSL
  3928.   /*
  3929.   Initialize the OpensSSL library
  3930.   */
  3931.   if (!openssl_ctx) {
  3932.     SSL_library_init();
  3933.     SSL_load_error_strings();
  3934.     ERR_load_crypto_strings();
  3935.     ERR_load_SSL_strings();
  3936.     SSLeay_add_ssl_algorithms();
  3937.     // OpenSSL_add_all_algorithms();
  3938.     openssl_ctx = SSL_CTX_new(SSLv23_client_method());
  3939.     if (!openssl_ctx) {
  3940.       fprintf(stderr, "fatal: unable to initialize TLS: SSL_CTX_new(SSLv23_client_method)\n");
  3941.       abort();
  3942.     }
  3943.   }
  3944. #endif
  3945.   
  3946.   /* Init vars and thread-specific values */
  3947.   hts_initvar();
  3948.   
  3949.   return 1;
  3950. }
  3951. int hts_uninit(void) {
  3952.   hts_freevar();
  3953.   /* htswrap_free(); */
  3954.   return 1;
  3955. }
  3956.  
  3957. // defaut wrappers
  3958. void __cdecl htsdefault_init(void) {
  3959. }
  3960. void __cdecl htsdefault_uninit(void) {
  3961.   hts_freevar();
  3962. }
  3963. int __cdecl htsdefault_start(void* opt) {
  3964.   return 1; 
  3965. }
  3966. int __cdecl htsdefault_chopt(void* opt) {
  3967.   return 1;
  3968. }
  3969. int  __cdecl htsdefault_end(void) { 
  3970.   return 1; 
  3971. }
  3972. int __cdecl htsdefault_checkhtml(char* html,int len,char* url_adresse,char* url_fichier) {
  3973.   return 1;
  3974. }
  3975. int __cdecl htsdefault_loop(void* back,int back_max,int back_index,int lien_n,int lien_tot,int stat_time,hts_stat_struct* stats) {    // appelΘ α chaque boucle de HTTrack
  3976.   return 1;
  3977. }
  3978. char* __cdecl htsdefault_query(char* question) {
  3979.   return "";
  3980. }
  3981. char* __cdecl htsdefault_query2(char* question) {
  3982.   return "";
  3983. }
  3984. char* __cdecl htsdefault_query3(char* question) {
  3985.   return "";
  3986. }
  3987. int __cdecl htsdefault_check(char* adr,char* fil,int status) {
  3988.   return -1;
  3989. }
  3990. void __cdecl htsdefault_pause(char* lockfile) {
  3991.   while (fexist(lockfile)) {
  3992.     Sleep(1000);
  3993.   }
  3994. }
  3995. void __cdecl htsdefault_filesave(char* file) {
  3996. }
  3997. int __cdecl htsdefault_linkdetected(char* link) {
  3998.   return 1;
  3999. }
  4000. int __cdecl htsdefault_xfrstatus(void* back) {
  4001.   return 1;
  4002. }
  4003. int __cdecl htsdefault_savename(char* adr_complete,char* fil_complete,char* referer_adr,char* referer_fil,char* save) {
  4004.   return 1;
  4005. }
  4006. // end defaut wrappers
  4007.  
  4008.  
  4009.  
  4010. // Fin
  4011.  
  4012.